基本信息
源码名称:K-Means 聚类算法,数据类型
源码大小:0.71M
文件格式:.doc
开发语言:Python
更新时间:2021-12-17
   友情提示:(无需注册或充值,赞助后即可获取资源下载链接)

     嘿,亲!知识可是无价之宝呢,但咱这精心整理的资料也耗费了不少心血呀。小小地破费一下,绝对物超所值哦!如有下载和支付问题,请联系我们QQ(微信同号):813200300

本次赞助数额为: 3 元 
   源码介绍

K-Means 聚类算法,数据类型


1.K-Means 聚类算法

K-Means 算法是典型的基于距离的非层次聚类算法,在最小化误差函数的基础上将数据划分为预定的类数 K,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大。 K-Means 聚类算法中,一般需要度量样本之间的距离、样本与簇之间的距离以及簇与簇之间的距离。度量样本之间的相似性最常用的是欧几里得距离、曼哈顿距离和闵可夫斯基距离。

2.算法过程:

1)从 N 个样本数据中随机选取 K 个对象作为初始的聚类中心;

2)分别计算每个样本到各个聚类中心的距离,将对象分配到距离最近的聚类中;

3)所有对象分配完成后,重新计算 K 个聚类的中心;

4)与前一次计算得到的 K 个聚类中心比较,如果聚类中心发生变化,转2),否则转5);

5)当质心不发生变化时停止并输出聚类结果。

3.数据类型与相似性的度量:

1)连续属性

对于连续属性,要先对各属性值进行零-均值规范,再进行距离的计算。

2)目标函数

使用误差平方和 SSE 作为度量聚类质量的目标函数,对于两种不同的聚类结果,选择误差平方和较小的分类结果。