K-Means 聚类算法，数据类型

基本信息

源码名称：K-Means 聚类算法，数据类型

源码大小：0.71M

文件格式：.doc

开发语言：Python

更新时间：2021-12-17

友情提示：（无需注册或充值，赞助后即可获取资源下载链接）

嘿，亲！知识可是无价之宝呢，但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下，绝对物超所值哦！如有下载和支付问题，请联系我们QQ(微信同号)：78630559

本次赞助数额为： 3 元　

源码介绍

K-Means 聚类算法，数据类型

1.K-Means 聚类算法

K-Means 算法是典型的基于距离的非层次聚类算法，在最小化误差函数的基础上将数据划分为预定的类数 K，采用距离作为相似性的评价指标，即认为两个对象的距离越近，其相似度就越大。 K-Means 聚类算法中，一般需要度量样本之间的距离、样本与簇之间的距离以及簇与簇之间的距离。度量样本之间的相似性最常用的是欧几里得距离、曼哈顿距离和闵可夫斯基距离。

2.算法过程：

1）从 N 个样本数据中随机选取 K 个对象作为初始的聚类中心；

2）分别计算每个样本到各个聚类中心的距离，将对象分配到距离最近的聚类中；

3）所有对象分配完成后，重新计算 K 个聚类的中心；

4）与前一次计算得到的 K 个聚类中心比较，如果聚类中心发生变化，转2)，否则转5)；

5）当质心不发生变化时停止并输出聚类结果。

3.数据类型与相似性的度量：

1）连续属性

对于连续属性，要先对各属性值进行零-均值规范，再进行距离的计算。

2）目标函数

使用误差平方和 SSE 作为度量聚类质量的目标函数，对于两种不同的聚类结果，选择误差平方和较小的分类结果。