python聚类实例分析

这篇文章主要介绍“python聚类实例分析”，在日常操作中，相信很多人在python聚类实例分析问题上存在疑惑，小编查阅了各式资料，整理出简单好用的操作方法，希望对大家解答”python聚类实例分析”的疑惑有所帮助！接下来，请跟着小编一起来学习吧！

成都创新互联公司长期为数千家客户提供的网站建设服务，团队从业经验10年，关注不同地域、不同群体，并针对不同对象提供差异化的产品和服务；打造开放共赢平台，与合作伙伴共同营造健康的互联网生态环境。为额济纳企业提供专业的成都网站建设、网站建设，额济纳网站改版等技术服务。拥有十年丰富建站经验和众多成功案例,为您定制开发。

聚类分析

将数据存储为csv格式，导入python，查看前10行数据。

import pandas as pd
reviewsdata = pd.read_csv('reviewsdata.csv',index_col=0)#index_col=0第一列所为行索引
reviewsdata.head(10)

python聚类实例分析

从表格中，可以看到不同性别、不同年龄使用不同单词的频数。对数据进行聚类分析，并画出聚类树形图。

import scipy
import scipy.cluster.hierarchy as sch
import matplotlib.pylab as plt
import pylab
#生成点与点之间的距离矩阵,这里用的欧氏距离:
disMat = sch.distance.pdist(reviewsdata.T,'euclidean')
#进行层次聚类:
Z=sch.linkage(disMat,method='average')
#将层级聚类结果以树状图表示出来并保存为plot_dendrogram.png
sch.dendrogram(Z,labels=reviewsdata.columns,leaf_font_size=7.5)
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.title("口碑的聚类")
pylab.show()

python聚类实例分析

在聚类分析的过程中，是将不同性别年龄的人群使用词的频数生成向量，然后比较这些向量的距离，将距离较近的总结在一起。距离近意味着措辞相仿，聚类也就是不断合并两个最相近向量的过程。从图显示，40多岁男性和50多岁男性在使用单词方面很接近，但跟60多岁女性明显不同。整体上，能看出不同年龄段和不同性别之间存在意见差异。

几个小概念

聚类分析：一种根据数据相似度将数据分组对手法，分组前，不能确定每一类的特征。数据相似度通过距离来判断，求距离的方法有很多种，最简单的为欧式距离。本文使用的是层次聚类，文章聚类（一）：DBSCAN算法实现（r语言）中介绍了DBSCAN聚类方法。

到此，关于“python聚类实例分析”的学习就结束了，希望能够解决大家的疑惑。理论与实践的搭配能更好的帮助大家学习，快去试试吧！若想继续学习更多相关知识，请继续关注创新互联网站，小编会继续努力为大家带来更多实用的文章！

本文名称：python聚类实例分析
当前网址：http://myzitong.com/article/jssspo.html

python聚类实例分析

其他资讯