
上QQ阅读APP看书,第一时间看更新
第5章 K-Means算法
K-Means算法是聚类算法中相对比较基础的一种,它假设将某些数据分为不同的类别,在相同的类别中数据之间的距离应该都很近,也就是说离得越近的数据应该越相似,而不同类别的数据则相对较远,也就越不相似。物以类聚,靠得近的东西是同一类。这样的假设是十分符合人类直觉的,正是建立在这样的直观逻辑上,K-Means算法易于理解。而“靠得近”又是一个值得深入思考的技术点,对算法的创新也往往基于这个点展开,本章将介绍K-Means算法,用最常见的欧氏距离来度量样本的远近。