2021
12-09
12-09
python聚类算法选择方法实例
说明1、如果数据集是高维度的,选择谱聚类是子空间的一种。2、如果数据量是中小型的,比如在100W条以内,K均值会是更好的选择;如果数据量超过100W条,可以考虑使用MiniBatchKMeans。3、如果数据集中有噪声(离群点),使用基于密度的DBSCAN可以有效解决这个问题。4、若追求更高的分类准确性,则选择谱聚类比K均值准确性更好。实例importnumpyasnpimportmatplotlib.pyplotasplt#数据准备raw_data=np.loadtxt('./pythonlea...
继续阅读 >