聚类分析就是把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低。聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等问题。与分类方法不同,聚类要划分的类是未知的,聚类分析是根据观察学习来确定数据之间的关系,因此是一种无监督学习。常用的聚类方法包括基于划分的方法(例如k-均值算法)、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。
聚类分析就是把一组数据按照差异性和相似性分为几个类别,使得同类的数据相似性尽量大,不同类的数据相似性尽可能小,跨类的数据关联性尽可能低。聚类分析常用于客户细分、文本归类、结构分组、行为跟踪等问题。与分类方法不同,聚类要划分的类是未知的,聚类分析是根据观察学习来确定数据之间的关系,因此是一种无监督学习。常用的聚类方法包括基于划分的方法(例如k-均值算法)、基于分层的方法、基于密度的方法、基于网格的方法和基于模型的方法。