数据可视化实验报告_第1页
数据可视化实验报告_第2页
数据可视化实验报告_第3页
数据可视化实验报告_第4页
数据可视化实验报告_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、实验七 图分析(Gephi与Python的使用)小组成员:一、实验目的熟悉Python图可视化;熟悉Gephi的使用;将Gephi与Python结合实现可视化。二、实验要求学生提前熟悉资料;由小组成员集体完成实验,成员分块写实验报告,代码后写注释。三、实验内容及步骤悲惨世界人物关系图(Python实现)代码import networkx as nx#用于创造、操作复杂网络,以及学习复杂网络的结构、动力学及其功能import pylabfrom pylab import rcParams#pylab模块是一款由python提供的可以绘制二维,三维数据的工具模块#指定此图片的大小,和像素rcPar

2、amsfigure.figsize=12,12G=nx.read_gml(C:/Users/Administrator/Desktop/悲 惨世 界/lesmiserables.gml)#读取gml文件,记为GG8=G.copy() #G的内容复制给G8dn=nx.degree(G8) #得到G8内节点的度#选出G8内所有节点的度小于8的节点,并删除这些节点for n in list(G8.nodes():if dnn=8:G8.remove_node(n)pos=nx.spring_layout(G8) #布局指定节点排列形式nx.draw(G8,node_size=10,edge_colo

3、r=b,alpha=0.45,font_size=9,pos=pos)#画图,节点大小10,边的颜色为蓝色,透明度0.45,节点标签字体大小9labels=nx.draw_networkx_labels(G8,pos=pos) #绘制网络 G8 的边图 pylab.show()结果展示FdiriUiiA科幻作者关系图(Python与Gephi与实现)代码import csvnodemap=() #创建一个空的列表#此函数功能是:找、添加节点,并计数def addNode(name):if name in nodemap:node=nodemapnamenodecount+=1#在nodemap

4、中,假如有此节点,此节点计数+1else:node=nodeid:name,count:1nodemapname=node#如果没有该节点,则记录该节点名称,数量记为1,添加到nodemapreturnwith open(C:/Users/Administrator/Desktop/科幻作者/SciFiWriters.txt,r) as inputfile:#打开txt文件,把它作为inputfile文件,r为只读模式datareader=csv.reader(inputfile,delimiter=t)#从csv文件中读取数据,记录为datareader,分隔符:横向制表符next(data

5、reader,None)#跳过第一行数据#过每一行数据,添加起点,和目标点fOr row in datareader:addNode(row0)addNode(row1)with open(node.txt,w,newline=) as nodefile:#打开文件记为nodefile文件,以w的方式,newline=为不写入空行formatter=csv.writer(nodefile,delimiter=t)#从csv文件中写入数据,记录为formatter,分隔符:横向制表符formatter.writerow(Id,Count) #第一行写为 ID Count#把nodemap内所有节

6、点,名称和数量写入formatter内for name in nodemap:node=nodemapnameformatter.writerow(nodenodeid,nodecount,)结果展示一 - 红楼梦人物词云图代码import jieba.analysefrom os import pathfrom scipy.misc import imreadimport matplotlib as mplimport matplotlib.pyplot as pltfrom wordcloud import WordCloud, STOPWORDS, ImageColorGenerator

7、mpl.rcParamsfbnt.sans-serif = FangSong # 识别中文字体,默认设为仿宋content = open(C:/Users/Administrator/Desktop/词云图 /hongloumeng.txt,rb).read()#打开红楼梦的txt文件,以content记录tags = jieba.analyse.extract_tags(content, topK=100, withWeight=False)#提取content中的关键词,返回K个权重最大的关键词,不返回权重text = .join(tags) #text 变量中存入 tags 的内容tru

8、mp_coloring = imread(path.join(ciyun.jpg)#生成词云wc = WordCloud(fbnt_path=simsun.ttc,background_color=white, max_words=300,mask=trump_coloring,max_font_size=40, random_state=42)#设置词云样式,背景色为白色,最大字数为300,字体最大为40#其中font_path部分为设定中文字体(识别中英文),random_state为42种配色方案 wc.generate(text) #以 text 生成单词云image_colors =

9、 ImageColorGenerator(trump_coloring)#改变字体颜色,从图像中plt.imshow(wc) #显示词云图plt.axis(off) #不显示x轴、y轴下标plt.show()结果展示老爷有鬟东茜?这些箱之口W乖十玄 答应咱们舞妙什mt口曰;众VC太太不过保们默虫只是瞰理国贾政泮就%听啜琏源牝四、思考1、关于图的逻辑(存储)表示不是能很好的呈现顶点之间的关系,而通过python读取 gml文件,对其文件的内容,进行图的描绘,可以有效的观察到各个顶点之间的关系。2、python中有许多方法可以对许多东西进行统计,而读取文件,把文件中的数据进行 清洗、处理,然后再对其数据进行有规律的保存,也可以对保存的文件进行不同格式之间的 转换。拿到数据、提取数据,这是数据可视化中数据的重要的环节。五、实验总结1.收获学习了 networkx库的部分函数,对于用图的方式来表示关系,有了进一步的认识。学 习了数据读取,并且处理数据的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论