Python快乐编程-数据分析与实战 习题答案(清华)_第1页
Python快乐编程-数据分析与实战 习题答案(清华)_第2页
Python快乐编程-数据分析与实战 习题答案(清华)_第3页
Python快乐编程-数据分析与实战 习题答案(清华)_第4页
Python快乐编程-数据分析与实战 习题答案(清华)_第5页
已阅读5页,还剩1页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python快乐编程一一数据分析与实战习题答案

第三章

—••

1.ndarray数据类型矩阵

2.dtypesizeshapeitemsziendim

3.matmatrix

4.排序去重使用内置函数进行处理

1.B

2.B

3.AC

4.D

1.重置数组的形状

2.创建一个全部参数为1的数组

第四章-Pandas的基本操作

1.A

2.D

3.B

4.CD

—•,

1.

read_sql_table

read_sql_query

read_sql

2.dropnafillnaisnullnotnull

3.reindex

1.Frame和Series

2.

⑴使用unique进行唯一性判断

(2)使用value_count进行次数统计

(3)使用isin进行成员资格检查

第五章

A

A

C

A

二:

步骤1:绘制画布

步骤2:添加子图并绘制图形

步骤3:规定x,y轴及相关标签

步骤4:保存图片或者显示

第六章

参考答案:

1.Timestamp,Period,Timedelta,DatetimelndexzPeriodtimelndexzTimedeltalndex

2.to_timestamp

3.获取对应的日期的星期名(如Wonday)

4.floor,ceil,round

l.D

2.A

3.A

4.A

5.B

四:

更正结果

1.

importpandasaspd

time_index=pd.date」ange("l/l/20”,periods=10,freq="lh30min")

print(timejndex)

2.

importpandasaspd

mg=pd.period_range("l/l/2000","6/30/2000",freq="M")

print(rng)

3.

p=pd.Period(“2019”,freq="A-DEC")

time=p.asfreq("D")#年初

print(time)

第七章

1.how字符串类型inner

2.concat

3.corrmethod

4.量纲[0,1]或者卜1,1]

5.最大■最小标准化方法、Z-score标准化方法、小数定标标准化方法。

1.D

2.C

3.D

4.A

5.A

1.错

2.对

3.错

4.对

四.

1.箱型图和基于3。方法

箱型图的

优点:直观、方便

缺点:数据量比较大时不能直接观察确切的值

3o方法:

优点:能够将值的分离出来

缺点:数据源只能是服从正态分布

五.

第八章

一.填空题

1.文本处理常用的Python库有和。

2.jieba库支持、、三种分词模式。

3.NLTK库由、、开发而成。

4.文本相似度分析可以使用—库和—库。

5.文本情感分析又被称为—、和—、,指的是带有情感色彩的主观性文本进行

―、和—的过程

1.NLTK\jieba

2.精确模式全模式搜索引擎模式

3.StevenBirdEdwardLope

4.NLTKgensim

5.倾向性分析意见挖掘分析处理归纳推理

选择题

1.下列关于jieba说法正确的是()

A.jieba分词包含4种工作模式

B.jieba分词可以用于英文文本

C.jieba分词的默认模式为精确模式

D.jieba分词可以自定义停止词词典

2.下列关于NLTK说法正确的是()

A.NLTK可以用于若干种语言

B.NLTK不可用于中文文本分析

C.NLTK词性标注CC表示连击词

D.NLTK免费开源

3.下列关于文本相似度分析说法不正确的是()

A.gensim使用词袋模型进行文本分析

B.token2id值是词典中词语的序号

C.文本相似度计算的对象是词频向量

D.余弦相似度计算能表示所有文本内容的比较

4.下列关于情感分析说法不正确的是()

A.情感分词主要使用train函数训练模型

B.词典分词不适合大量的文章

C.朴素贝叶斯分析不适合小量的文章

D.情感分析有又称为意向挖掘

1-4:CCDC

三.判断题

1.NLTK分词只能用于英文。()

2.jibe分词只能用于中文。()

3.停止词对文本分析没有任何帮助。()

4.jieba分词在词干提取时可以使用并行模式()

5.gensim模块不能处理英文文本。()

1.错

2.对

3.对

4.错

5.错

四.简答题

1.文本处理的基本流程?(8.1.1)

2.什么是余弦相似度分析?(8.4.1)

3.文本相似度分析的应用场景()

第9章-参考答案

答案:

1.回归模型、聚类模型、分类模型

2.R八2值法、绝对均方误差、解释方差、平均绝对误差

3.A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论