数据采集与存储学习通超星期末考试答案章节答案2024年_第1页
数据采集与存储学习通超星期末考试答案章节答案2024年_第2页
数据采集与存储学习通超星期末考试答案章节答案2024年_第3页
数据采集与存储学习通超星期末考试答案章节答案2024年_第4页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据采集与存储学习通超星期末考试章节答案2024年使用Python,都有哪些方法可以访问JSON文件内容,有何区别?

答案:可以使用Python的基本文件读(和写)操作,也可以使用专用模块JSON更方便地操作。另外,还可以使用Pandas模块操作读写JSON数据更简洁,如read_json何to_json方法。什么是JSON文件?其内容如何组织,形式上对应于Python的哪些数据类型?

答案:JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式,易于阅读和编写,同时也易于机器解析和生成。JSON文件采用完全独立于编程语言的文本格式来存储和表示数据。其内容组织形式为:对象和数组。其中对象是一个无序的“‘名称/值’对”集合,数组是值(value)的有序集合。因此,形式上分别对应于Python中的字典和列表数据类型。以下为扩展信息:

一个对象以“{”(左括号)开始,“}”(右括号)结束。每个“名称”后跟一个“:”(冒号);“‘名称/值’对”之间使用“,”(逗号)分隔。

一个数组以“[”(左中括号)开始,“]”(右中括号)结束。值之间使用“,”(逗号)分隔。什么是CSV文件?Python的哪些方法可以访问CSV文件内容?

答案:CSV-逗号分隔值(Comma-SeparatedValues文件,有时也称为字符分隔值,因为分隔字符也可以不是逗号,可以是制表符、分号、冒号等。CSV不是一种正式的文件格式,而是一个以文本文件表示的表,其中单元格由分隔符分隔。读取CSV文件有多种方法,可以使用Python的基本文件读(和写)操作,也可以使用CSV模块读写,还可以使用Pandas模块对CSV文件内容更便捷地读写操作。什么是伯努利分布和二项分布,两者有何联系?

答案:伯努利分布的假设是一个事件只有发生或者不发生两种可能,并且这两种可能是固定不变的。如果假设事件发生的概率是p,那么它不发生的概率就是1-p。这就是伯努利分布。生活中所有只可能出现两种结果并且概率保持不变的事件都可以认为服从伯努利分布(比如抛硬币)。伯努利实验就是做一次服从伯努利概率分布的事件,它发生的可能性是p,不发生的可能性是1-p。二项分布就是多次伯努利分布实验的概率分布。伯努利分布和二项分布都是离散型概率分布。Python的哪些模块及方法,可以生成基本的离散型随机变量和连续型随机变量数据样本?

答案:numpy模块提供了基本的离散型随机变量(二项分布、泊松分布、超几何分布)和连续型随机变量(均匀分布、正态分布、指数分布)数据样本方法。比如:numpy.random.binomial()方法可以生成满足二项分布的离散型随机变量数据样本;numpy.random.poisson()方法可以生成满足泊松分布的离散型随机变量数据样本;numpy.random.hypergeometric()方法可以生成满足超几何分布分布的离散型随机变量数据样本;numpy.random.uniform()方法可以生成满足均匀分布的连续型随机变量数据样本;numpy.random.randn()方法可以生成满足正态分布的连续型随机变量数据样本;numpy.random.exponential()方法可以生成满足指数分布的连续型随机变量数据样本。除此之外,scipy模块和Pandas模块的DataFrame对象也提供了相应的方法。【各方法详细介绍可参考:/miaochangq/article/details/110119364】Python内置函数_________可以返回列表、元组、字典、集合对象中元素个数。

答案:len(使用列表推导式生成包含10个数字5的列表(使用变量名i,range函数),语句可以写为______________________。

答案:[5foriinrange(10python解释器执行

'abbacabb'.strip('ab')的结果是()。

答案:'c'

Numpy生成的数组中,随机选择部分样本使用的函数是()。

答案:choice()调用函数时,在实参前面加一个符号*表示什么?

答案:序列解包python运算符%的作用,包含哪些?

答案:求余和格式化字符串python3.x支持使用中文命名变量。

答案:正确Python中,字符串s='abc',那么执行表达式s+'d'之后,s的打印结果是什么?

答案:'abc'numpy中根据起止数据等间距地生成数组的函数是()

答案:linspace()如何查看缺失值?处理缺失值都有哪些方法?Python中的缺失值都有哪些表示形式?

答案:在Python中,可以通过查看或统计对应变量的Null、NaN、nan、NA等缺失值来查看缺失值,对于字符串,还可以查看其值是否为“”形式检查。

处理缺失值的方法很多,如忽略存在缺失值的记录、去掉包含缺失数据的属性、手工填写缺失值、使用默认值代替缺失值、使用属性平均值(中位数或众数)代替缺失值、使用同类样本平均值代替缺失值、预测最可能的值代替缺失值等。

Python中的缺失值表示形式较多,如Null、NaN、nan、NA等缺失值。分别简述numpy中的二维和多维数组与pandas中数据结构Series和DataFrame作用,并简述其区别。

答案:(1)NumPy是高性能科学计算和数据分析的基础包,支持一维、二维及多维数组,其中ndarray是一个具有矢量算术运算和复杂广播能力的快速且节省空间的多维数组,具有用于对数组数据进行快速运算的标准数学函数(如矩阵运算,无需编写循环)。

(2)Pandas中的Series,只是一个一维数据结构,它由index和value组成;DataFrame,是一个二维结构,除了拥有index和value之外,还拥有column,常用于二维表数据的存取、运算和处理。DataFrame由多个Series组成,无论是行还是列,单独拆分出来都是一个Series,常用于读取和处理二维表格形式的数据,方便进行连接、合并、分组、统计等操作。

(3)numpy是pandas数据结构的基础,Series相当于numpy中的一维数组对象,但有自己的索引对象;DataFrame相当于numpy中的二维或多维数组,但有自己的列索引和行索引,不同列的数据类型可以不同。使用pandas如何清洗数据?

答案:在pandas中可使用方法dropna()来处理数据缺失值;方法cleaned()来清除缺失值;方法isnull()来标明缺失值;方法fillna()来填充缺失值。Pandas都提供了哪些方法可以读取外部数据源?

答案:Pandas提供了丰富的外部数据源访问接口,如CSV、JSON、XML、HTML、EXCEL、关系数据库等,相应的函数则是以read_或to_打头的读写函数。已知列表对象x=['abc','ab','a'],则表达式max(x,key=len)的值为___________。

答案:'abc'假设列表对象L的值为[3,4,5,6,7,9,11,13,15,17],那么切片L[3:7]得到的值是______________________。

答案:[6,7,9,11]Python3.X中,分别查询长度为一百万的列表和字典的靠后的元素,哪个速度更快?

答案:字典快现有代码d={},在python3解释器中执行d[([1,2])]='b'得到的结果()

答案:TypeError:unhashabletype:'

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论