爱豆吧!

idouba@beta.

Data Mining 笔记聚类k-medoids

一、概述 k-means利用簇内点的均值或加权平均值ci(质心)作为类Ci的代表点。对数值属性数据有较好的几何和统计意义。对孤立点是敏感的,如果具有极大值,就可能大幅度地扭曲数据的分布. k-medoids(k-中心点)算法是为消除这种敏感性提出的,它选择类中位置最接近类中心的对象(称为中心点)作为类的代表点,目标函数仍然可以采用平方误差准则。 PAM(Partitioning Around Medoids,围绕中心点的划分)是最早提出的k中心点算法之一。 二、算法思想: 随机选择k个对象作为初始的k个类的代表点,将其 Read more →