人工智能算法大全:基于MATLAB
上QQ阅读APP看书,第一时间看更新

6.2 高斯混合聚类算法的优缺点

高斯混合聚类是一种十分经典的聚类算法,也可以说是对K-Means算法的一种改进,在实践中有着广泛的运用,本节将对这一算法的优缺点进行简要介绍。

1.高斯混合聚类算法的优点

GMM是聚类算法中较为典型的一种,其优点如下。

1)相比K-Means的“硬聚类”,GMM以概率密度作为划分依据,实现了一种“软聚类”。

2)基于EM算法,参数迭代是自组织的,计算效率也相对较高。

3)不仅可以得到聚类结果,也可以得到分布参数等有助于分析的参数。

2.高斯混合聚类算法的缺点

GMM假设前提过于理想化,聚类效果好坏很大程度上取决于原始数据,其缺点如下。

1)对于分布的假设基于正态分布,这在实践中常常不成立,或只是近似成立。

2)迭代可能陷入局部最优。

3)实践中对于计算特征共线性等问题,会导致计算过程出现偏倚。