Python编程基础 课件 CH05列表元组:绘制CPC历史决议词云图_第1页
Python编程基础 课件 CH05列表元组:绘制CPC历史决议词云图_第2页
Python编程基础 课件 CH05列表元组:绘制CPC历史决议词云图_第3页
Python编程基础 课件 CH05列表元组:绘制CPC历史决议词云图_第4页
Python编程基础 课件 CH05列表元组:绘制CPC历史决议词云图_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深入浅出Python编程

(模块3数据结构)第5单元绘制CPC历史决议词云图

直接显示词云图片使用jieba模块实现分词操作使用with-as语句打开文件;使用列表/元组实现对关键词的统计;使用列表推导式获取前20的关键词。Outcome单元目标/Objectives理解线性(linear)数据结构

熟练掌握列表list的使用

熟练掌握元组tuple的使用

理解Python对象的可变与不可变

掌握文件数据输入基本操作⑥具有爱国情怀和民族自信心内容及计划/Agenda&Schedule8/6ClassHoursDetails专科应用本科<00:10><00:10>回顾&成果目标<00:25><00:25>文件的基本操作<02:40><02:00>使用列表&创建词云图<02:00><01:20>元组使用及改写实现<00:05><00:05>课堂小结Total:8/6hours(6/4hPractice)Total:54Hours(24hPractice)01《决议》词云图CloudWord1.任务分析目标解构一是,从《决议》文件读取全文本内容二是,提取关键词并统计关键词出现的次数三是,生成并显示词云图片模式识别文件数据输入/只读分词->过滤->去重->统计->排序Top201.任务分析模式归纳(关键词1,出现次数),(关键词2,出现次数)……的数据结构来表示“关键词-次数”数据对序列结构可以使用列表(list)统计结果可以使用列表或元组算法设计open()函数等方法打开文件/jieba第三方模块实现分词列表/元组操作数据/sort()方法或sorted()函数实现排序wordcloud+matplotlib绘制并显示词云图2.任务准备jieba模块第三方中文分词函数库jieba.lcut()WordCloud模块第三方词云库,根据你给出字符串,以不同的大小、颜色显示出来中文需要提供使用字体的路径,否则会出现乱码wordcloud.WordCloud()创建词云图2.任务准备matplotlib模块Python最著名的2D绘图库只使用matplotlib.pyplot绘制wordcloud生成的词云图片matplotlib模块①引入模块初始化环境,设想已经准备好了一块画板;②准备好要使用的数据;③把数据装入坐标轴,画图/渲染两种方法:①axes.Axes对象在画板figure.Figure上画图;②matplotlib.pyplot()02文件输入FileInput1.读取文件输入认识文件文本文件(textfile):基于字符编码(ASCII、UTF-8等)的文件,能够使用字符串str对象读写的文件对象(fileobject)二进制文件(binaryfile):基于值,没有编码,只是一个字节序列,存储的是二进制数据打开文件语法:stream=open(file_name,mode)r-以只读方式(read)打开文件;如果省略时,默认值为'r'w-以写(write)数据方式打开文件,如果同名文件已经存在,则会被覆盖a-打开文件并追加(append)内容,任何写入的数据会自动添加到文件末尾t-表示操作的是一个文本(text)文件b-表示操作的是一个二进制(binary)文件1.读取文件输入f.read(size):读取并返回最多size个字符f.readline():读取单行数据f.write(str):把str的内容写入文件f.close():关闭文件2.使用with打开文件with-as上下文管理器(contextmanager)读取决议文件数据并分词03列表List1.列表的基本操作—

创建中文标点符号列表创建列表[]/

list()元素是有位序的1.列表的基本操作—

创建中文标点符号列表创建拼音字符列表的两种方式[]:直接赋值创建list():将一个字符串进行类型转换创建1.列表的基本操作—

访问和遍历列表访问列表数据项索引切片1.列表的基本操作—

访问和遍历列表遍历列表数据项值迭代索引遍历1.列表的基本操作—

修改列表及计算在列表中添加元素append()extend()1.列表的基本操作—

修改列表及计算更新列表中的元素重新赋值数据项要确保“回写”1.列表的基本操作—

修改列表及计算列表的计算操作加法:合并列表乘法:重复列表1.列表的基本操作—

(逆序)删除标点符号列表的删除操作pop()方法:按元素的位置删除remove()方法:按元素的值删除del命令1.列表的基本操作—

(逆序)删除标点符号删除标点符号执行删除操作的过程中数据项的位置会发生改变故采用逆序搜索前进1.列表的基本操作—

列表的嵌套:remove()删除拼音嵌套列表的数据项又可以是一个列表,这称之为列表的嵌套形如[

['!',10],['《',8],……]按值遍历删除拼音字符remove()方法遍历删除copy():生成一份列表的副本count():统计数据项在列表中出现的次数统计关键词频次2.统计分词关键词出现的频次关键词去重3.排序关键词并绘制词云图排序sort()方法物理排序sorted()函数逻辑排序3.排序关键词并绘制词云图列表推导式(listcomprehension)处理一个序列中的所有或部分元素并返回结果列表的一种紧凑写法3.排序关键词并绘制词云图列表推导式(listcomprehension)列表推导式实现鸡兔同笼问题实际是使用嵌套列表解析(NestedListComprehensions)获得top20关键词3.排序关键词并绘制词云图创建词云图创建/配置WordCloud对象空格分隔关键词生成词云图片显示词云图Plt.imgshow()Plt.show()绘制词云图4.复制和清空列表—

深复制和浅复制copy()vs.=4.复制和清空列表—

深复制和浅复制嵌套列表的赋值情况4.复制和清空列表—

深复制和浅复制deepcopy()4.复制和清空列表—

清空列表clear()方法:只是简单的清空列表的数据[]重新赋值:重新分配内存空间04元组tuple1.元组的基本操作创建元组/tupletuple()/()1.元组的基本操作创建元组/tuple要创建只有一个元素的元组,要在这个元素的后面加一个逗号1.元组的基本操作索引与运算元组是有序的,可以按位序进行索引操作元组也可以进行加法和乘法操作,与列表类似1.元组的基本操作遍历for–in的成员运算符进行迭代“赋值”元组是不可变的2.使用元组统计关键词关键词统计数据对,用元组替换列表2.使用元组统计关键词元组推导式求解百鸡百钱问题使用列表改写绘制词云图统计关键词代码使用列表推导式,求解百鸡百钱问题课堂小结列表是Python中非常高频使用的一种数据类型,和字符串一样,它也支持索

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论