K-Means
是一种最经典和常用的聚类方法。它通过多轮迭代的方式不断更新不同类样本的中心,计算样本到每个中心的距离,然后更新样本所属的类。最终能够把样本划分到
K 个类中。本案例中,我们首先使用 Python 实现 K-Means 算法,基于一份随机数据集,使用动画演示聚类过程和优化目标的变化。然后将
K-Means 应用于图像分割问题。最后我们还将使用一份中文新闻数据集,用 K-Means
算法进行自动新闻主题聚类,并使用柱状图和词云图对聚类结果进行可视化分析。
![png](http://cookdata.cn/media/note_images/下载_1591418994274_5d14.jpg)