Python数据科学方法与实践(山东联盟)智慧树知到课后章节答案2023年下山东师范大学_第1页
Python数据科学方法与实践(山东联盟)智慧树知到课后章节答案2023年下山东师范大学_第2页
Python数据科学方法与实践(山东联盟)智慧树知到课后章节答案2023年下山东师范大学_第3页
Python数据科学方法与实践(山东联盟)智慧树知到课后章节答案2023年下山东师范大学_第4页
Python数据科学方法与实践(山东联盟)智慧树知到课后章节答案2023年下山东师范大学_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python数据科学方法与实践(山东联盟)智慧树知到课后章节答案2023年下山东师范大学山东师范大学

第一章测试

目前,数据密集型科学研究的范式也称为科学研究的()。

A:第三范式B:第四范式C:第二范式D:第一范式

答案:第四范式

在DrewConway提出的数据科学韦恩图中,危险区是指()。

A:忽视计算机编程的能力B:重视机器学习算法的掌握C:忽视专业领域知识的掌握D:缺乏数学解释的能力

答案:缺乏数学解释的能力

以下不属于数据离散程度统计指标的是()。

A:方差B:标准差C:极差D:数学期望

答案:数学期望

随着大数据、人工智能的发展,数据科学与()建立了本质性的联系。

A:深度学习B:机器学习C:数据挖掘D:统计学

答案:数据挖掘

IBM提出的大数据“5V”理论,增加了()特征。

A:Veracity(真实性)B:Value(价值密度低)C:Velocity(速度快)D:Variety(多样性)

答案:Veracity(真实性)

随着大数据的广泛应用和技术的不断创新,人们的思维模式也发生了很大的变化,以下不属于大数据思维的是()。

A:总体性思维B:相关性思维C:容错性思维D:因果性思维

答案:因果性思维

当今大数据区别于传统的小数据,其主要差异不包括()。

A:数据来源B:数据特点C:应用需求D:技术框架

答案:数据来源

目前,对大数据分析技术面临的主要挑战,描述错误的是()。

A:数据生存环境是动态变化的,具有很强的不确定性B:数据往往伴有噪声,对数据的管理和评价容易出现偏差C:数据处理分析算法需要在实时性和准确率之间做出平衡D:数据分布广泛,只有在集成后才能更好地处理和分析

答案:数据分布广泛,只有在集成后才能更好地处理和分析

大数据技术生态中,使用流处理模式,适用于大型互联网服务日志采集的系统是()。

A:SparkSQLB:RabbitMQC:RocketMQD:Kafka

答案:Kafka

以下不属于大数据分析和挖掘技术平台的是()。

A:ApacheDrillB:TensorFlowC:ImpalaD:ZooKeeper

答案:ZooKeeper

有大数据就有小数据,二者在理论和技术上既有联系、又有区别。()

A:错B:对

答案:对

HadoopYARN是一个通用的资源管理系统,它可以将资源管理和作业调度、监控分离,为上层应用提供统一的资源管理和调度。()

A:对B:错

答案:对

对数据进行可视化处理,可以更形象直观地观察数据之间的规律,以便更好地发现数据中潜在的价值和模式。()

A:对B:错

答案:对

目前,大数据的规模和复杂性不断提升,越来越需要人工智能理论和技术的支持。()

A:对B:错

答案:对

ZooKeeper作为一个典型的分布式数据一致性解决方案,提供了配置维护、域名服务、分布式同步、组服务等功能。()

A:对B:错

答案:对

目前,高性能计算和机器学习已经成为大数据智能分析的核心技术。()

A:错B:对

答案:对

Tableau属于可编程的数据可视化分析工具。()

A:错B:对

答案:错

Python环境下,可以在第三方库的支持下进行大数据的处理和分析。()

A:错B:对

答案:对

大数据时代,数据量和数据的价值都呈指数级增长。()

A:对B:错

答案:错

近年来,对数据规模的度量,已经开始使用EB和ZB作为单位。()

A:对B:错

答案:错

第二章测试

使用pip命令可以下载安装Python的()。

A:自定义库B:标准库C:内置库D:外部扩展库

答案:外部扩展库

使用Python的import命令不可以导入()。

A:__bulitins__B:pandasC:numpyD:math

答案:__bulitins__

关于Python语言,以下说法不正确的是()。

A:一条语句可以使用续行符“”在多行上书写B:一行只能有一条语句C:一种解释性高级语言D:严格使用缩进来表示程序代码的逻辑关系

答案:一行只能有一条语句

执行语句sum(list(range(1,10,2)))之后,显示的运算结果是()。

A:25B:45C:[1,3,5,7,9]D:20

答案:25

在Python环境中执行语句i=3;i+=3后,变量i的值是()。

A:6B:不确定C:3D:0

答案:6

已知x=[1,1],y=[2,2],则x+y的结果是()。

A:[2,2]B:[3,3]C:[1,1]D:[1,1,2,2]

答案:[1,1,2,2]

执行语句age=[18,20,19,17];age.pop()之后,显示的结果为()。

A:18B:19C:20D:17

答案:17

执行语句x=[1,2,3]*3之后,语句x.index(2)的运算结果是()。

A:2B:0C:3D:1

答案:1

表达式sum([x*xforxinrange(5)])的计算结果是()。

A:15B:30C:5D:20

答案:30

表达式tuple(enumerate(range(3)))的计算结果是()。

A:((1,1),(2,2),(3,3))B:(0,1,2)C:((0,0),(1,1),(2,2))D:(1,2,3)

答案:((0,0),(1,1),(2,2))

执行语句系列g=(i**2foriinrange(1,4));list(g);next(g),最后的显示结果为()。

A:报错B:(1,4,9)C:[1,4,9]D:[1,2,3]

答案:报错

执行语句系列x,y,z={1:"a",2:"b",3:"c"};x,y=y,z之后,则变量y的值为()。

A:3B:2C:"c"D:1

答案:3

关于Python中字典的使用,以下说法不正确的是()。

A:字典中的每个元素以“键:值”形式表示B:字典中的“键”允许重复C:可使用字典对象的values属性访问字典的所有值D:字典的标识符为{}

答案:字典中的“键”允许重复

Python是一种强类型动态语言,变量的类型可以随时变化。()

A:错B:对

答案:对

Python中的range对象是可迭代对象,常用在for循环中控制循环的次数。()

A:对B:错

答案:对

执行语句x=y=3后,变量x、y指向同一个内存地址。()

A:对B:错

答案:对

Python对标识符严格区分大小写。()

A:错B:对

答案:对

在Python中定义函数时,必须要声明函数返回值的类型。()

A:对B:错

答案:错

Python中函数的形式参数与实际参数的个数必须一致。()

A:错B:对

答案:错

Python表达式Trueor1/0的运算结果为True。()

A:对B:错

答案:对

Python中的生成器对象具有惰性求值的特点,每次可以访问其中的任意一个元素。()

A:对B:错

答案:错

Python中没有字符类型,只有字符串类型。()

A:错B:对

答案:对

Python的一个常量、变量、数据类型或函数等都可以看作是一个对象。()

A:对B:错

答案:对

以下属于Python内置序列对象的有()。

A:字典(dict)B:集合(set)C:元组(tuple)D:列表(list)

答案:字典(dict);集合(set);元组(tuple);列表(list)

序列结构是Python的一种重要数据结构,以下属于可变序列的有()。

A:集合(set)B:列表(list)C:元组(tuple)D:字典(dict)

答案:集合(set);列表(list);字典(dict)

Python程序常用的基本控制结构有()。

A:迭代结构B:顺序结构C:循环结构D:分支结构

答案:顺序结构;循环结构;分支结构

在Python中定义函数时,允许使用的函数参数形式有()。

A:关键字参数B:可变长度参数C:位置参数D:默认值参数

答案:关键字参数;可变长度参数;位置参数;默认值参数

关于Python类的实例属性,以下说法正确的是()。

A:同一个类生成的多个对象,其实例属性互不影响B:类的实例属性只能在类的构造方法中定义C:类的每个实例对象都拥有该类实例属性的副本D:在定义类时,以“self.属性名称”格式访问其实例属性

答案:同一个类生成的多个对象,其实例属性互不影响;类的每个实例对象都拥有该类实例属性的副本;在定义类时,以“self.属性名称”格式访问其实例属性

在Python中定义类的成员方法时,可以采用的不同形式有()。

A:类方法B:抽象方法C:静态方法D:实例方法

答案:类方法;静态方法;实例方法

以下能够使用切片方式访问其中部分成员的对象有()。

A:元组B:字符串C:列表D:字典

答案:元组;字符串;列表

在使用Python的内置函数open打开文件时,能够指定的文本解码方式有()。

A:BIG-5B:GBKC:UTF-8D:CP936

答案:GBK;UTF-8;CP936

当Python函数的实际参数个数不确定时,可以使用*或**定义可变长度参数,则可以传递的实际参数类型有()。

A:默认值参数B:无限制C:位置参数D:关键字参数

答案:位置参数;关键字参数

第三章测试

设numpy数组arr=np.arange(10),要将该数组中偶数选择处理,以下正确的是()。

A:np.where(arr%2==0)B:arr[arr%2==True]C:arr[arr%2==0]D:arr[::2]

答案:arr[arr%2==True]

使用numpy的split函数分割数组arr,如果该函数的第二个参数为[3,5],则表示要划分arr为()个子数组。

A:2B:1C:3D:4

答案:3

设数组a、b均为1行3列的一维数组,使用numpy.stack函数连接数组a和b时,若参数axis=-1,则()。

A:按默认的轴方向进行连接B:不允许,将提示错误C:连接轴为列,等价于axis=1D:连接轴为行,等价于axis=0

答案:连接轴为列,等价于axis=1

设数组a、b均为1行6列的一维数组,若执行赋值语句a=b;b.shape=2,3,则以下说法正确的是()。

A:数组a和b均变为2行3列B:数组a和b的形状均保持不变C:数组b的形状改变,而数组a形状不变D:数组a和b具有不同的存储单元地址

答案:数组a和b均变为2行3列

ndarray对象是numpy库的核心数据结构,关于该对象的说法,以下不正确的是()。

A:是一个N维数组B:元素的下标默认从0开始C:元素的数据类型相同D:每个元素的存储空间大小不同

答案:每个元素的存储空间大小不同

使用numpy库的array函数分别创建数组a和b,其中,则a+b的运算结果是()。

A:B:C:D:不能运算,报错

答案:

Numpy库提供了线性代数子模块linalg,其中专门用于计算Hermitian矩阵或对称矩阵特征值和特征向量的函数是()。

A:eighB:eigC:eigvalshD:eigvals

答案:eigh

在numpy环境中,如果要将一个二维数组a2d的相应行中减去一维数组b1d的每一项,以下方法正确的是()。

A:a2d-b1d[:,:]

B:a2d-b1d[:,None]C:a2d-b1d[:,NaN]D:a2d-b1d

答案:a2d-b1d[:,None]

设数组x=numpy.arange(1,9,2),则表达式x[numpy.where(x<5,x,-1)]的运算结果为()。

A:array([3,0,0,0])B:array([1,3,-1,-1])C:array([3,7,7,7])D:array([3,1,1,1])

答案:array([3,7,7,7])

设数组x=numpy.linspace(-2,2,3),则表达式numpy.piecewise(x,[x<0,x>=0],[lambdax:-x,lambdax:x])的运算结果为()。

A:array([1.,0.,1.])B:array([2.,0.,2.])C:array([-2.,0.,-2.])D:array([-1.,0.,-1.])

答案:array([2.,0.,2.])

设有numpy数组arr=np.arange(9).reshape(3,3),则arr[:,::-1]的作用是()。

A:行列互换B:列倒序C:数组保持不变D:行倒序

答案:列倒序

设有numpy数组arr=np.arange(9).reshape(3,3),则要交换该数组的第1、第2行,以下表达式正确的是()。

A:arr[[0,2,1],:]B:arr[:,[0,2,1]]C:arr[:,[1,0,2]]D:arr[[1,0,2],:]

答案:arr[[1,0,2],:]

形状兼容时,numpy可以进行广播操作,以下运算中没有广播操作的是()。

A:a=np.ones((2,3));b=np.arange(3);a+bB:a=np.arange(3).reshape(3,1);b=np.arange(3);a+bC:a=np.random.randn(2,3);a*3D:a=np.ones((3,2));b=np.arange(3);a*b

答案:a=np.ones((3,2));b=np.arange(3);a*b

设numpy数组arr=np.arange(10),要将该数组中的偶数选择出来,以下表达式不正确的是()。

A:np.where(arr%2==0)B:arr[arr%2==0]C:np.where(np.mod(arr,2))D:arr[::2]

答案:np.where(np.mod(arr,2))

numpy提供了random随机模块,使用该模块可产生标准正态分布随机数的是()。

A:randnB:radomC:normalD:rand

答案:randn

使用Numpy的reshape方法,可以同时改变数组的维数和大小。()

A:对B:错

答案:错

使用Numpy的resize方法,可以同时改变数组的维数和大小。()

A:错B:对

答案:对

如果两个数组的维度相同,但大小不同,则这两个数组不能进行算术运算。()

A:对B:错

答案:错

设数组a=np.arange(9).reshape(3,3),则表达式a[:,[1,0,2]]的作用是交换数组a的两列。()

A:对B:错

答案:对

如果两个由数值数据组成的数组进行点积运算的结果为0,则表示这两个数组对应的向量垂直。()

A:对B:错

答案:对

一个两行三列的数组可以看作为两个三维的向量。()

A:错B:对

答案:对

在计算数据集的中心倾向时,均值对数据中的异常值不敏感。()

A:对B:错

答案:错

百分位数常用于描述一组有序数据中的各数据项如何在最小值和最大值之间分布。()

A:错B:对

答案:对

数据离散度的计算很容易受到其中一小部分异常值的影响。()

A:对B:错

答案:错

当计算数据的标准差结果为0时,表示数据聚集在一起。()

A:错B:对

答案:对

numpy库中使用的ndarray数组要求数据类型必须一致。()

A:错B:对

答案:错

设数组a=np.arange(6).reshape(3,2),则表达式a[::-1]的作用是翻转数组a的两列。()

A:对B:错

答案:对

计算数据之间的相关性,可以使用numpy库的corrcoef函数。()

A:错B:对

答案:对

使用numpy库random子模块的randint函数每次只能生成一个随机整数。()

A:错B:对

答案:错

使用numpy库的amax函数可以对多维数组的每一行求最大值。()

A:错B:对

答案:对

在计算机上使用数值近似解方法解决实际问题时,不可避免地会引入误差,其主要来源类型有()。

A:舍入误差B:模型误差C:截断误差D:观测误差

答案:舍入误差;模型误差;截断误差;观测误差

对Numpy库的描述,以下正确的是()。

A:是基于Python环境的科学计算基础包B:是Python的外部扩展库C:只支持数值类型的运算D:其核心功能的实现受ndarray对象的支持

答案:是基于Python环境的科学计算基础包;是Python的外部扩展库;其核心功能的实现受ndarray对象的支持

对Numpy库中ndarray对象的描述,以下说法正确的是()。

A:对象中每个元素的存储空间大小相同B:是一个多维数组C:元素可使用下标索引方式访问D:对象中元素的数据类型必须相同

答案:对象中每个元素的存储空间大小相同;是一个多维数组;元素可使用下标索引方式访问

使用Numpy库可以创建单位矩阵形式数组的函数有()。

A:onesB:eyeC:zerosD:identity

答案:eye;identity

可以创建三角矩阵的Numpy库函数有()。

A:triuB:diagC:trilD:tri

答案:triu;tril;tri

在numpy环境中执行语句序列a=np.array([1,2,3]);b=np.unique(np.append(a,2))后,以下说法正确的是()。

A:数组b的内容为array([1,2,3])B:数组a的内容没有改变C:数组a和b是同一个数组D:数组a和b的内容相同

答案:数组b的内容为array([1,2,3]);数组a的内容没有改变;数组a和b的内容相同

将二维数组转换为一维数组,可以使用的方法有()。

A:ndarray.resizeB:numpy.flattenC:ndarray.reshapeD:numpy.ravel

答案:ndarray.resize;ndarray.reshape;numpy.ravel

使用numpy创建数组a=np.random.randint(1,10,[3,3]),则执行语句b=a[:,::-1]后,以下说法正确的是()。

A:数组a和b的形状相同B:数组a中的元素按行倒置后得到数组bC:数组a的内容保持不变D:数组a中的元素按列倒置后得到数组b

答案:数组a和b的形状相同;数组a的内容保持不变;数组a中的元素按列倒置后得到数组b

Numpy库提供了线性代数子模块linalg,支持的运算包括()。

A:矩阵的分解和规范化B:求解线性方程组C:矩阵和矢量的基本运算D:求解矩阵的特征值

答案:矩阵的分解和规范化;求解线性方程组;矩阵和矢量的基本运算;求解矩阵的特征值

常用的矩阵分解方法包括()。

A:三角分解(LU)B:奇异值分解(SVD)C:正交分解D:QR分解

答案:三角分解(LU);奇异值分解(SVD);QR分解

使用索引访问数组中的元素时,索引的形式可以是()。

A:切片索引B:字段名称索引C:整数数组索引D:布尔数组索引

答案:切片索引;字段名称索引;整数数组索引;布尔数组索引

设arr是一个3行3列的numpy数值型数组,则以下操作返回原始对象视图的有()。

A:arr.view()B:arr+2C:arr[:]D:arr.flatten()

答案:arr.view();arr[:]

以下属于numpy库子模块的有()。

A:maB:matlibC:randomD:linalg

答案:ma;matlib;random;linalg

numpy库中的linalg子模块可以用来()。

A:求两个向量的欧式距离B:计算两个矩阵的乘法C:求解线性方程组D:计算矩阵的行列式

答案:求两个向量的欧式距离;计算两个矩阵的乘法;求解线性方程组;计算矩阵的行列式

使用numbers=np.random.uniform(0,20,20)语句创建一个numpy数组,要提取该数组中的整数部分,以下方法正确的是()。

A:np.floor(numbers)B:numbers.astype(int)C:numbers-numbers%1D:np.trunc(numbers)

答案:np.floor(numbers);numbers.astype(int);numbers-numbers%1;np.trunc(numbers)

第四章测试

对pandas库的描述,以下说法错误的是()。

A:是一种高效且功能强大的数据分析包B:非常适合于关系型和标记型数据的处理和分析C:是Python的外部扩展库,需要预先下载和安装D:只支持一维和二维的数据处理分析

答案:只支持一维和二维的数据处理分析

关于DataFrame对象的描述,以下不正确的是()。

A:元素值可变B:等价于二维的ndarray对象C:对象大小可变D:存储异构数据

答案:等价于二维的ndarray对象

关于Series对象的描述,以下不正确的是()。

A:是一个带标签的一维数组B:对象中的元素值是可变的C:对象的大小是可变的D:对象中的数据是均匀的

答案:对象的大小是可变的

DataFrame对象使用一种行列交叉的表格结构,则以下描述不正确的是()。

A:缺省情况下,默认的行、列标识都从0开始B:行和列允许增加或删除C:每一列允许使用不同的数据类型D:每一行和列都具有相应的标签作为标识

答案:每一列允许使用不同的数据类型

假设执行s=pd.Series(np.random.randn(5))语句,已经创建了一个Series对象,则以下允许的操作有()。

A:执行s[0]=True,同时修改元素的值和数据类型B:执行s[:]=s[:]+1,修改所有元素的值C:执行s.size=6,改变对象的大小D:执行s.index=list("abcde"),改变对象的索引标识

答案:执行s.size=6,改变对象的大小

创建Series对象时,不可以作为其输入数据的是()。

A:Python的集合对象B:numpy的ndarray对象C:Python的字典对象D:标量值,如数字3

答案:Python的集合对象

若DataFrame对象是一个由10行4列组成的数值型数据集,则要使用DataFrame对象的sum函数统计每一行的总和,应设置参数()。

A:axis=0B:axis=FalseC:axis=1D:axis=True

答案:axis=1

设df是一个由100行5列组成的DataFrame对象,其中第5列标识为“Species”,数据类型是字符串型,要统计该列中每个字符串的长度,以下表达式正确的是()。

A:len(df["species"])B:df["species"].map(lambdas:len(s))C:df["species"].count()D:map(lambdas:len(s),df["species"])

答案:df["species"].map(lambdas:len(s))

假设一个DataFrame对象df的第1列标识为“Species”,由不同物种名称的字符串组成,要统计该列中不同类别物种的个数,以下表达式正确的是()。

A:count(df["species"].unique())B:len(df["species"].unique())C:df["species"].count().unique()D:df.value_counts("species").unique()

答案:len(df["species"].unique())

假设df为已经创建的DataFrame对象,且其列标识分别为“A”、“B”、“C”、“D”,则语句df.sort_values(by=["B","D"])的作用是()。

A:分别按B列、D列降序排序B:先按B列升序排序,B列相同时再按D列升序排序C:分别按B列、D列升序排序D:先按B列降序排序,B列相同时再按D列降序排序

答案:先按B列升序排序,B列相同时再按D列升序排序

在进行数据预处理时,可以被pandas理解为缺失值的有()。

A:pandas模块提供的NaNB:其余选项都是C:Python内置的NoneD:numpy模块提供的nan

答案:其余选项都是

若DataFrame对象df中存在重复数据,执行该对象的drop_duplicates方法,则以下说法不正确的是()。

A:删除重复数据后,行索引保持不变B:可以将df中所有的重复数据真正删除C:只能删除df中行完全重复的所有数据D:可以删除df中指定列完全重复的所有数据

答案:只能删除df中行完全重复的所有数据

若DataFrame对象df存储的数据集中存在不同程度的缺失值NaN,则执行该对象的dropna方法删除这些缺失值时,以下说法正确的是()。

A:对象df中的原数据会始终保持不变B:若参数axis=0,只要某行中存在缺失值,该行数据将被全部删除C:若参数axis=0且每行都存在缺失值,df将成为一个空的DataFrame对象D:若参数axis=1且每列都存在缺失值,df将成为一个空的DataFrame对象

答案:对象df中的原数据会始终保持不变

使用3σ原则检测数据集中的异常值时,其中的σ是指()。

A:标准差B:方差C:极差D:均值

答案:标准差

以下属于二进制文件格式的有()。

A:JSONB:TXTC:MSEXCELD:XML

答案:MSEXCEL

在pandas库与时间相关的类中,带有时区信息,表示某个具体时间点的类是()。

A:TimestampB:PeriodC:TimedeltaD:Datetime

答案:Timestamp

在时间序列的处理和分析中,目前不考虑时区因素而作为国际通用时间标准的是()。

A:ESTB:DSTC:GMTD:UTC

答案:UTC

在Python环境中,汇编世界时区信息,且封装在pandas库中,为时区信息的使用带来极大便利的第三方库是()。

A:DateutilB:pytzC:PyTimeD:datetime

答案:pytz

数据分类是有效提高大数据集分析时空效率的必要手段,则以下关于数据分类的说法不正确的是()。

A:数据分类的时间代价较大时,分类是不必要的B:对分类数据的操作速度会更快C:分类数据通常占用更少的内存D:分类数据通常用整数编码

答案:数据分类的时间代价较大时,分类是不必要的

使用DataFrame对象的sort_values方法对其中存储的数据进行排序时,以下允许的操作是()

A:设置要排序的顺序B:设置要排序的索引标识C:设置要排序的轴向D:设置要排序的列名

答案:设置要排序的索引标识

使用DataFrame对象的concat()方法,可以将两个数据集合并成一个数据集。()

A:错B:对

答案:错

使用DataFrame对象的groupby()方法对数据进行分组得到的GroupBy对象包含所有分组计算的结果。()

A:对B:错

答案:错

使用Pandas的read_json()函数,在读取JSON格式文件的同时,可以解析文件中的数据内容。()

A:错B:对

答案:对

FuzzyWuzzy是Python环境下对字符串模糊匹配的第三方库,它默认使用Python的标准库difflib进行字符串匹配。()

A:对B:错

答案:对

对数据进行标准差标准化后,数据的值限定在[0,1]之间。()

A:对B:错

答案:错

使用层次化索引可以在低维上访问到DataFrame对象的高维元素。()

A:对B:错

答案:对

numpy库提供的Series对象即使只有一个轴,也能使用分层索引。()

A:对B:错

答案:对

使用DataFrame对象的unstack()方法,可以将其中的行转换为列,得到一个具有多层索引的Series对象。()

A:对B:错

答案:错

若两个数据子集的列数分别为n1、n2,则使用Pandas的merge方法按主键合并这两个数据子集时,合并后的结果数据集中的列数为n1+n2。()

A:对B:错

答案:错

可以将numpy的ndarray数组对象转换为pandas的Series对象。()

A:错B:对

答案:对

使用DataFrame对象的head方法,仅能查看数据集中前5行的数据。()

A:错B:对

答案:错

可以通过对DataFrame对象的shape属性重新赋值的方式改变其形状。()

A:对B:错

答案:错

使用DataFrame对象的reindex方法重构索引时,若该对象中原来没有索引标识“h”,则索引“h”对应的行将填充为NaN。()

A:对B:错

答案:对

使用DataFrame对象的iloc方法选取行数据时,只能使用整数形式的索引标识。()

A:对B:错

答案:对

Python的外部扩展库pandas不具有图表绘制的功能。()

A:错B:对

答案:错

在使用DataFrame对象的groupby方法进行分组计算时,若分组键是列标识的列表,则分组的结果会以层次化索引表示和存储。()

A:对B:错

答案:对

JSON格式的数据是以键-值对形式存储的序列化文本类型数据,可以使用pandas库的read_json和to_json方法读写。()

A:错B:对

答案:对

如果数据集中表示日期时间的数据是一个很大的整数,一般是指在内部从新纪元Epoch开始的秒数。()

A:错B:对

答案:对

在表示时间序列的频率中,WOM-3FRI表示每月第3个星期五。()

A:对B:错

答案:对

以协调世界时UTC形式表示的时间戳值是带有时区信息的,在进行运算时需要进行时区的转换。()

A:错B:对

答案:错

执行语句序列data=[[4,5,6],[4,5,6],[4,5,6]];df=pd.DataFrame(data,columns=list("ABC"))创建DataFrame对象df,则以下可以将df中值为5的数据修改为数值10的语句是()。

A:df.loc[:,"B"]=5B:df.replace(5,10,inplace=True)C:df[df.values==5]=10D:df["B"]=10

答案:df.loc[:,"B"]=5;df.replace(5,10,inplace=True);df[df.values==5]=10;df["B"]=10

使用pandas库可以直接读取的外部文件格式包括()。

A:Excel格式文件B:HTML格式文件C:XML格式文件D:CSV格式文件

答案:Excel格式文件;HTML格式文件;XML格式文件;CSV格式文件

在pandas环境中对数据进行聚合,DataFrame对象的groupby方法是一种常用的形式,则以下相关说法正确的是()。

A:分组后的结果可以直接显示查看B:一般遵循拆分、应用、合并的过程C:函数作为分组键时,函数的返回值作为分组的名称D:分组生成的GroupBy对象包含数据分组的所有信息

答案:一般遵循拆分、应用、合并的过程;函数作为分组键时,函数的返回值作为分组的名称;分组生成的GroupBy对象包含数据分组的所有信息

对时间序列数据的重采样,以下说法正确的是()。

A:降采样时一般要进行相应的聚合运算B:对以日期为索引的时间序列升采样时目标频率必须是源频率的超时期C:升采样时会产生大量的缺失值D:本质上是频率转换的过程

答案:降采样时一般要进行相应的聚合运算;升采样时会产生大量的缺失值;本质上是频率转换的过程

在进行时间序列分析时,以时间顺序排列构成的观测样本序列数据集,一般具有的基本特性包括()。

A:季节性变化B:周期性C:随机性D:趋势性

答案:季节性变化;周期性;随机性;趋势性

对时间序列的分析和预测,可以通过移动窗口并在窗口上进行统计计算的方式。Pandas应用于移动窗口计算的常用函数有()。

A:ewmB:expandingC:shiftD:rolling

答案:ewm;expanding;rolling

在Pandas环境中使用分类数据,以下说法正确的是()。

A:分类数据通常占用少的多的内存空间B:支持分类类型的底层算法采用整数编码数组,速度更快C:操作分类对象Categorical的方法是通过其cat属性提供的D:可以人为指定分类数据的整数编码

答案:分类数据通常占用少的多的内存空间;支持分类类型的底层算法采用整数编码数组,速度更快;操作分类对象Categorical的方法是通过其cat属性提供的;可以人为指定分类数据的整数编码

在Python环境中,可以使用链式编程思想的场景有()。

A:对数据集进行一系列变换B:关系运算表达式C:闭包函数的调用D:自定义类成员方法的调用

答案:对数据集进行一系列变换;关系运算表达式;闭包函数的调用;自定义类成员方法的调用

在pandas的数据合并方法中,既可以按行合并,又可以按列合并的方法有()。

A:concatB:joinC:appendD:merge

答案:concat;join;merge

以下属于pandas库自带的基本数据结构的是()。

A:DataFrameB:ndarrayC:listD:Series

答案:DataFrame;Series

假设执行df=pd.DataFrame(np.random.randn(4,3),index=range(4),columns=["one","two","three"])语句已经正确创建了一个DataFrame对象,则以下允许的操作有()。

A:执行df["four"]=df["one"]+df["three"]添加一列B:执行df.index=list("abcd")改变对象的索引标识C:执行df.pop("two")删除第二列D:执行df.iloc[2]选择第三行

答案:执行df["four"]=df["one"]+df["three"]添加一列;执行df.index=list("abcd")改变对象的索引标识;执行df.pop("two")删除第二列;执行df.iloc[2]选择第三行

使用DataFrame对象的describe方法,可以查看数据集的()。

A:每个数值列的数据项个数B:每个非数值列的类别数C:每个数值列的标准差D:每行的最大值和最小值

答案:每个数值列的数据项个数;每个非数值列的类别数;每个数值列的标准差

使用DataFrame对象的groupby方法对数据进行分组后,得到一个GroupBy对象,则以下关于GroupBy对象的说法正确的是()。

A:该对象包含对数值列的分组计算结果B:该对象包含要进行分组计算的所有信息C:是一个可迭代对象,由分组键值和对应的数据块组成D:可以通过该对象直接查看分组的结果

答案:该对象包含要进行分组计算的所有信息;是一个可迭代对象,由分组键值和对应的数据块组成

采用分组机制对数据进行计算时,以下对分组聚合和解封的说法正确的是()。

A:transform方法是对分组解封后的数据转换运算B:只能对数据集中的数值型数据进行计算C:可以直接在分组对象上执行统计计算D:apply方法是在各个分组结果上的聚合运算

答案:transform方法是对分组解封后的数据转换运算;只能对数据集中的数值型数据进行计算;可以直接在分组对象上执行统计计算;apply方法是在各个分组结果上的聚合运算

在使用pandas库的get_dummies方法对分类特征进行哑变量处理以满足某些回归分析模型对数值型输入的要求时,以下说法正确的是()。

A:哑变量处理后的数据变得更加稀疏,因此降低了模型的运算速度B:哑变量的数值没有数量大小的意义,一般为0或1C:某一输入特征有n种分类时,可以设置n-1个哑变量D:get_dummies可以接收DataFrame对象的一列作为要处理的哑变量

答案:哑变量的数值没有数量大小的意义,一般为0或1;某一输入特征有n种分类时,可以设置n-1个哑变量;get_dummies可以接收DataFrame对象的一列作为要处理的哑变量

在进行数据处理分析时,对数据进行离散化处理的原因主要有()。

A:简化数据结构,更容易理解B:减少数据量,降低算法的时空开销C:模型算法的要求D:提高算法对样本的抗噪声能力

答案:简化数据结构,更容易理解;减少数据量,降低算法的时空开销;模型算法的要求;提高算法对样本的抗噪声能力

在进行数据的处理分析时,要求对原始数据进行标准化处理,其主要原因有()。

A:保证算法的准确性B:消除数据特征之间量纲的差异C:保证结果的可靠性D:消除评价指标之间的数量级差异

答案:消除数据特征之间量纲的差异;保证结果的可靠性;消除评价指标之间的数量级差异

在pandas库的数据组织方式上,允许使用层次化索引,以使得在同一个轴上可以拥有多个索引级别,其主要原因有()。

A:更容易实现不同层次的数据交换和排序B:使得DataFrame对象可以存储和操作三维的数据C:能够以低维方式处理高维数据D:数据子集的选取和访问更加简单

答案:更容易实现不同层次的数据交换和排序;使得DataFrame对象可以存储和操作三维的数据;能够以低维方式处理高维数据;数据子集的选取和访问更加简单

第五章测试

Matplotlib库中用于实现绘图功能的最主要模块是()。

A:animationB:figureC:styleD:pylot

答案:pylot

使用matplotlib库绘制图表时,关于画布和坐标轴,即figure对象和axes对象的描述,以下不正确的是()。

A:调用plot方法绘制图形时,会自动创建一个figure对象和一个axes对象B:一个figure对象可以包含多个axes对象C:一个axes对象只能在一个figure对象中使用D:在同一个figure对象上绘制的多个图形只能共用一个axes对象

答案:在同一个figure对象上绘制的多个图形只能共用一个axes对象

为保证数据集中的数据点值能够在坐标轴上全部画出,使得坐标轴的大小适应数据的显示,可以使用Matplotlib库绘图模块的()函数实现。

A:plotB:axisC:set_axesD:autoscale

答案:autoscale

使用matplotlib库绘制图表,要在图表中添加注解,应调用pyplot模块的()方法来实现。

A:figureB:annotateC:plotD:legend

答案:annotate

使用matplotlib.pyplot模块的subplot方法在画布上绘制子图时,在调用subplot(2,1,1)之后,若再调用subplot(2,3,4),则创建的子图是()。

A:第2行的第3个子图B:第2行的第1个子图C:第2行的第2个子图D:第2行的第4个子图

答案:第2行的第1个子图

使用matplotlib.pyplot模块绘制柱形图和直方图时,以下说法不正确的是()。

A:绘制柱形图和直方图时,柱子的宽度均可以不同B:柱形图和直方图所表示的数据均应具有连续性C:直方图中用柱子的宽度和高度均有意义D:柱形图中只有柱子的高度有意义

答案:柱形图和直方图所表示的数据均应具有连续性

制作词云图时,以下可以用来分词的模块是()。

A:echartsB:wordcloud2C:WordCloudD:jieba

答案:jieba

绘制三维线框图,可以使用mplot3d模块的()方法。

A:plotB:plot_wireframeC:plot3d_wireframeD:plot3d

答案:plot_wireframe

使用Axes3D对象的bar3d(x,y,z,dx,dy,dz)函数绘制三维柱状图时,其中的参数x、y和z表示()。

A:柱子的体积B:柱子的大小C:柱子锚点的坐标D:柱子的形状

答案:柱子锚点的坐标

三翼面图的绘制,可以使用Axes3D对象的()函数。

A:plot_trisurfB:contourfC:plot_wireframeD:plot_surface

答案:plot_trisurf

使用matplotlib库绘制图表时,若要将y轴的刻度设置为对数形式,应使用坐标轴对象axes的方法是()。

A:set_ylabelB:set_titleC:set_yticksD:set_yscale

答案:set_yscale

使用绘图模块pyplot的bar方法绘制柱形图时,要在同一个绘图区上绘制多个柱形图,且保证这些柱形图不重叠,正确的做法是()。

A:设置不同的x坐标位置B:设置柱子具有不同的宽度C:设置柱子不同的对齐方式D:同时调整柱形图的宽度和x轴上的坐标位置

答案:同时调整柱形图的宽度和x轴上的坐标位置

使用绘图模块pyplot的hist方法绘制直方图时,参数histtype用来设置要绘制的直方图类型,其值不可以设置为()。

A:barstackedB:stepC:barplotD:stepfilled

答案:barplot

使用pyplot模块的legend方法在绘图区添加图例时,参数loc用来指定图例框的位置,其取值有()种可能。

A:9B:10C:8D:11

答案:10

对常用的二维图表,以下说法不正确的是()。

A:直方图既能表现分组的大小,又能表现各分组的频率高低B:散点图可以用来推断数据特征之间的相关性C:饼图用来表现特征的占比情况,且对数量的比较更容易辨识D:柱状图只能在一个维度上进行比较

答案:饼图用来表现特征的占比情况,且对数量的比较更容易辨识

matplotlib是可以直接在Python环境中使用的标准库,无须事先安装。()

A:对B:错

答案:错

在使用matplotlib.pyplot模块中的plot()函数绘制折线图时,matplotlib会自动创建一个绘图区(figure)。()

A:对B:错

答案:对

堆积图可以表示不同部分对总量的数量贡献,只能表现事物的总体趋势。()

A:对B:错

答案:错

散点图可以用来判断不同数据集之间是否存在相关性。()

A:错B:对

答案:对

使用matpotlib.pyplot模块的xcorr方法绘制互相关图时,会通过numpy库的correlate函数自动计算数据之间的相关性。()

A:错B:对

答案:对

自相关图可以用来表现同一个数据集在不同时间周期内的相似度。()

A:错B:对

答案:对

使用matplotlib.animation模块的FuncAnimation类绘制动画时,每一帧的绘制都需要回调创建构成帧的绘图对象函数。()

A:错B:对

答案:对

使用matplotlib.animation模块的ArtistAnimation类绘制动画时,必须预先创建构成动画的每一帧图像。()

A:错B:对

答案:对

OpenGL是一种开放式图形库,独立于硬件和操作系统平台。()

A:对B:错

答案:对

NetworkX库提供了网络的可视化功能,因此使用NetworkX库绘制网络图时,不需要导入matplotlib库的绘图模块pyplot。()

A:对B:错

答案:错

PyLab模块不属于matplotlib库,它能够单独导入到Python环境并实现基本图表的绘制。()

A:错B:对

答案:对

使用matplotlib库既可以在平面直角坐标系下绘图,又可以在极坐标系下绘图。()

A:对B:错

答案:对

mplot3d是专门用来绘制三维图形的工具包,可以使用frommatplotlibimportmplot3d语句导入到Python环境。()

A:对B:错

答案:错

animation模块是属于matplotlib库的一个子模块,可以使用frommatplotlibimportanimation语句导入到Python,并使用其中的接口类生成动画。()

A:错B:对

答案:对

散点图可以用于表示三维特征的分布情况。()

A:错B:对

答案:对

以下属于图表基本组成的有()。

A:图表标题B:图例C:坐标轴D:绘图区

答案:图表标题;图例;坐标轴;绘图区

第三方库jieba为在Python环境中完成词云图的制作提供了必要的前提,其主要功能包括()。

A:对分词结果进行词频统计B:以不同模式对文本进行分词C:子模块posseg可以进行词性分析D:子模块analyse可以进行关键词提取

答案:以不同模式对文本进行分词;子模块posseg可以进行词性分析;子模块analyse可以进行关键词提取

在matplotlib的pyplot模块中,可以用来创建图表中的子区的方法有()。

A:subplot2gridB:GridSpecPlotC:subplotD:subplots

答案:subplot2grid;s

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论