Python数据科学方法与实践(山东联盟)知到智慧树章节测试课后答案2024年秋山东师范大学_第1页
Python数据科学方法与实践(山东联盟)知到智慧树章节测试课后答案2024年秋山东师范大学_第2页
Python数据科学方法与实践(山东联盟)知到智慧树章节测试课后答案2024年秋山东师范大学_第3页
Python数据科学方法与实践(山东联盟)知到智慧树章节测试课后答案2024年秋山东师范大学_第4页
Python数据科学方法与实践(山东联盟)知到智慧树章节测试课后答案2024年秋山东师范大学_第5页
已阅读5页,还剩23页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python数据科学方法与实践(山东联盟)知到智慧树章节测试课后答案2024年秋山东师范大学第一章单元测试

目前,数据密集型科学研究的范式也称为科学研究的()。

A:第二范式B:第四范式C:第三范式D:第一范式

答案:第四范式在DrewConway提出的数据科学韦恩图中,危险区是指()。

A:缺乏数学解释的能力B:忽视专业领域知识的掌握C:忽视计算机编程的能力D:重视机器学习算法的掌握

答案:缺乏数学解释的能力以下不属于数据离散程度统计指标的是()。

A:标准差B:方差C:数学期望D:极差

答案:数学期望随着大数据、人工智能的发展,数据科学与()建立了本质性的联系。

A:深度学习B:数据挖掘C:统计学D:机器学习

答案:数据挖掘IBM提出的大数据“5V”理论,增加了()特征。

A:Veracity(真实性)B:Velocity(速度快)C:Value(价值密度低)D:Variety(多样性)

答案:Veracity(真实性)随着大数据的广泛应用和技术的不断创新,人们的思维模式也发生了很大的变化,以下不属于大数据思维的是()。

A:因果性思维B:容错性思维C:相关性思维D:总体性思维

答案:因果性思维当今大数据区别于传统的小数据,其主要差异不包括()。

A:数据来源B:应用需求C:数据特点D:技术框架

答案:数据来源目前,对大数据分析技术面临的主要挑战,描述错误的是()。

A:数据往往伴有噪声,对数据的管理和评价容易出现偏差B:数据生存环境是动态变化的,具有很强的不确定性C:数据分布广泛,只有在集成后才能更好地处理和分析D:数据处理分析算法需要在实时性和准确率之间做出平衡

答案:数据分布广泛,只有在集成后才能更好地处理和分析大数据技术生态中,使用流处理模式,适用于大型互联网服务日志采集的系统是()。

A:KafkaB:RocketMQC:SparkSQLD:RabbitMQ

答案:Kafka以下不属于大数据分析和挖掘技术平台的是()。

A:ApacheDrillB:ZooKeeperC:TensorFlowD:Impala

答案:ZooKeeper有大数据就有小数据,二者在理论和技术上既有联系、又有区别。()

A:错B:对

答案:对HadoopYARN是一个通用的资源管理系统,它可以将资源管理和作业调度、监控分离,为上层应用提供统一的资源管理和调度。()

A:对B:错

答案:对对数据进行可视化处理,可以更形象直观地观察数据之间的规律,以便更好地发现数据中潜在的价值和模式。()

A:对B:错

答案:对目前,大数据的规模和复杂性不断提升,越来越需要人工智能理论和技术的支持。()

A:错B:对

答案:对ZooKeeper作为一个典型的分布式数据一致性解决方案,提供了配置维护、域名服务、分布式同步、组服务等功能。()

A:对B:错

答案:对目前,高性能计算和机器学习已经成为大数据智能分析的核心技术。()

A:对B:错

答案:对Tableau属于可编程的数据可视化分析工具。()

A:错B:对

答案:错Python环境下,可以在第三方库的支持下进行大数据的处理和分析。()

A:错B:对

答案:对大数据时代,数据量和数据的价值都呈指数级增长。()

A:对B:错

答案:错近年来,对数据规模的度量,已经开始使用EB和ZB作为单位。()

A:错B:对

答案:错

第二章单元测试

使用pip命令可以下载安装Python的()。

A:内置库B:自定义库C:外部扩展库D:标准库

答案:外部扩展库使用Python的import命令不可以导入()。

A:pandasB:numpyC:__bulitins__D:math

答案:__bulitins__Python的注释不可以使用()。

A:一对三单引号'''...'''B:一对“&”号C:单个“#”号D:一对三双引号"""..."""

答案:一对“&”号关于Python语言,以下说法不正确的是()。

A:一行只能有一条语句B:一条语句可以使用续行符“\”在多行上书写C:一种解释性高级语言D:严格使用缩进来表示程序代码的逻辑关系

答案:一行只能有一条语句执行语句sum(list(range(1,10,2)))之后,显示的运算结果是()。

A:45B:[1,3,5,7,9]C:20D:25

答案:25在Python环境中执行语句i=3;i+=3后,变量i的值是()。

A:不确定B:3C:0D:6

答案:6已知x=[1,1],y=[2,2],则x+y的结果是()。

A:[2,2]B:[3,3]C:[1,1,2,2]D:[1,1]

答案:[1,1,2,2]执行语句age=[18,20,19,17];age.pop()之后,显示的结果为()。

A:19B:18C:20D:17

答案:17执行语句x=[1,2,3]*3之后,语句x.index(2)的运算结果是()。

A:0B:3C:2D:1

答案:1执行语句list(zip(['i','j','k'],[1,2]))之后,生成的列表为()。

A:[('i',1),('j',2)]B:[['i',1],['j',2]]C:[('i',1),('j',2),('k',0)]D:[['i',1],['j',2],['k',0]]

答案:[('i',1),('j',2)]表达式sum([x*xforxinrange(5)])的计算结果是()。

A:20B:15C:30D:5

答案:30表达式tuple(enumerate(range(3)))的计算结果是()。

A:(0,1,2)B:((0,0),(1,1),(2,2))C:((1,1),(2,2),(3,3))D:(1,2,3)

答案:((0,0),(1,1),(2,2))执行语句系列g=(i**2foriinrange(1,4));list(g);next(g),最后的显示结果为()。

A:报错B:[1,2,3]C:[1,4,9]D:(1,4,9)

答案:报错执行语句系列x,y,z={1:"a",2:"b",3:"c"};x,y=y,z之后,则变量y的值为()。

A:3B:2C:1D:"c"

答案:3关于Python中字典的使用,以下说法不正确的是()。

A:字典中的“键”允许重复B:可使用字典对象的values属性访问字典的所有值C:字典的标识符为{}D:字典中的每个元素以“键:值”形式表示

答案:字典中的“键”允许重复Python是一种强类型动态语言,变量的类型可以随时变化。()

A:错B:对

答案:对Python中的range对象是可迭代对象,常用在for循环中控制循环的次数。()

A:错B:对

答案:对执行语句x=y=3后,变量x、y指向同一个内存地址。()

A:错B:对

答案:对Python对标识符严格区分大小写。()

A:错B:对

答案:对在Python中定义函数时,必须要声明函数返回值的类型。()

A:对B:错

答案:错Python中函数的形式参数与实际参数的个数必须一致。()

A:错B:对

答案:错Python表达式Trueor1/0的运算结果为True。()

A:对B:错

答案:对Python中的生成器对象具有惰性求值的特点,每次可以访问其中的任意一个元素。()

A:对B:错

答案:错Python中没有字符类型,只有字符串类型。()

A:对B:错

答案:对Python的一个常量、变量、数据类型或函数等都可以看作是一个对象。()

A:对B:错

答案:对以下属于Python内置序列对象的有()。

A:列表(list)B:元组(tuple)C:集合(set)D:字典(dict)

答案:列表(list);元组(tuple);集合(set);字典(dict)序列结构是Python的一种重要数据结构,以下属于可变序列的有()。

A:列表(list)B:集合(set)C:字典(dict)D:元组(tuple)

答案:列表(list);集合(set);字典(dict)Python程序常用的基本控制结构有()。

A:迭代结构B:顺序结构C:循环结构D:分支结构

答案:顺序结构;循环结构;分支结构在Python的选择和循环结构中,以下条件表达式的值可以解释为True的有()。

A:'a'!='b'B:NoneC:0D:10

答案:'a'!='b';10在Python中定义函数时,允许使用的函数参数形式有()。

A:位置参数B:可变长度参数C:默认值参数D:关键字参数

答案:位置参数;可变长度参数;默认值参数;关键字参数关于Python类的实例属性,以下说法正确的是()。

A:类的每个实例对象都拥有该类实例属性的副本B:在定义类时,以“self.属性名称”格式访问其实例属性C:同一个类生成的多个对象,其实例属性互不影响D:类的实例属性只能在类的构造方法中定义

答案:类的每个实例对象都拥有该类实例属性的副本;在定义类时,以“self.属性名称”格式访问其实例属性;同一个类生成的多个对象,其实例属性互不影响在Python中定义类的成员方法时,可以采用的不同形式有()。

A:抽象方法B:静态方法C:类方法D:实例方法

答案:静态方法;类方法;实例方法以下能够使用切片方式访问其中部分成员的对象有()。

A:字典B:列表C:元组D:字符串

答案:列表;元组;字符串在使用Python的内置函数open打开文件时,能够指定的文本解码方式有()。

A:CP936B:GBKC:UTF-8D:BIG-5

答案:CP936;GBK;UTF-8当Python函数的实际参数个数不确定时,可以使用*或**定义可变长度参数,则可以传递的实际参数类型有()。

A:默认值参数B:位置参数C:关键字参数D:无限制

答案:位置参数;关键字参数

第三章单元测试

设numpy数组arr=np.arange(10),要将该数组中偶数选择处理,以下正确的是()。

A:arr[arr%2==0]B:arr[arr%2==True]C:np.where(arr%2==0)D:arr[::2]

答案:arr[arr%2==True]使用numpy的split函数分割数组arr,如果该函数的第二个参数为[3,5],则表示要划分arr为()个子数组。

A:3B:1C:2D:4

答案:3设数组a、b均为1行3列的一维数组,使用numpy.stack函数连接数组a和b时,若参数axis=-1,则()。

A:不允许,将提示错误B:连接轴为行,等价于axis=0C:按默认的轴方向进行连接D:连接轴为列,等价于axis=1

答案:连接轴为列,等价于axis=1设数组a、b均为1行6列的一维数组,若执行赋值语句a=b;b.shape=2,3,则以下说法正确的是()。

A:数组a和b均变为2行3列B:数组a和b具有不同的存储单元地址C:数组b的形状改变,而数组a形状不变D:数组a和b的形状均保持不变

答案:数组a和b均变为2行3列ndarray对象是numpy库的核心数据结构,关于该对象的说法,以下不正确的是()。

A:是一个N维数组B:每个元素的存储空间大小不同C:元素的数据类型相同D:元素的下标默认从0开始

答案:每个元素的存储空间大小不同使用numpy库的array函数分别创建数组a和b,其中,则a+b的运算结果是()。

A:B:C:D:不能运算,报错

答案:Numpy库提供了线性代数子模块linalg,其中专门用于计算Hermitian矩阵或对称矩阵特征值和特征向量的函数是()。

A:eighB:eigC:eigvalshD:eigvals

答案:eigh在numpy环境中,如果要将一个二维数组a2d的相应行中减去一维数组b1d的每一项,以下方法正确的是()。

A:a2d-b1dB:a2d-b1d[:,:]

C:a2d-b1d[:,NaN]D:a2d-b1d[:,None]

答案:a2d-b1d[:,None]设数组x=numpy.arange(1,9,2),则表达式x[numpy.where(x<5,x,-1)]的运算结果为()。

A:array([3,7,7,7])B:array([3,0,0,0])C:array([1,3,-1,-1])D:array([3,1,1,1])

答案:array([3,7,7,7])设数组x=numpy.linspace(-2,2,3),则表达式numpy.piecewise(x,[x<0,x>=0],[lambdax:-x,lambdax:x])的运算结果为()。

A:array([2.,0.,2.])B:array([-1.,0.,-1.])C:array([-2.,0.,-2.])D:array([1.,0.,1.])

答案:array([2.,0.,2.])设有numpy数组arr=np.arange(9).reshape(3,3),则arr[:,::-1]的作用是()。

A:行倒序B:列倒序C:行列互换D:数组保持不变

答案:列倒序设有numpy数组arr=np.arange(9).reshape(3,3),则要交换该数组的第1、第2行,以下表达式正确的是()。

A:arr[[1,0,2],:]B:arr[:,[1,0,2]]C:arr[:,[0,2,1]]D:arr[[0,2,1],:]

答案:arr[[1,0,2],:]形状兼容时,numpy可以进行广播操作,以下运算中没有广播操作的是()。

A:a=np.random.randn(2,3);a*3B:a=np.arange(3).reshape(3,1);b=np.arange(3);a+bC:a=np.ones((2,3));b=np.arange(3);a+bD:a=np.ones((3,2));b=np.arange(3);a*b

答案:a=np.ones((3,2));b=np.arange(3);a*b设numpy数组arr=np.arange(10),要将该数组中的偶数选择出来,以下表达式不正确的是()。

A:arr[arr%2==0]B:np.where(arr%2==0)C:arr[::2]D:np.where(np.mod(arr,2))

答案:np.where(np.mod(arr,2))numpy提供了random随机模块,使用该模块可产生标准正态分布随机数的是()。

A:randB:normalC:randnD:radom

答案:randn使用Numpy的reshape方法,可以同时改变数组的维数和大小。()

A:错B:对

答案:错使用Numpy的resize方法,可以同时改变数组的维数和大小。()

A:错B:对

答案:对如果两个数组的维度相同,但大小不同,则这两个数组不能进行算术运算。()

A:错B:对

答案:错设数组a=np.arange(9).reshape(3,3),则表达式a[:,[1,0,2]]的作用是交换数组a的两列。()

A:错B:对

答案:对如果两个由数值数据组成的数组进行点积运算的结果为0,则表示这两个数组对应的向量垂直。()

A:错B:对

答案:对一个两行三列的数组可以看作为两个三维的向量。()

A:对B:错

答案:对在计算数据集的中心倾向时,均值对数据中的异常值不敏感。()

A:对B:错

答案:错百分位数常用于描述一组有序数据中的各数据项如何在最小值和最大值之间分布。()

A:对B:错

答案:对数据离散度的计算很容易受到其中一小部分异常值的影响。()

A:对B:错

答案:错当计算数据的标准差结果为0时,表示数据聚集在一起。()

A:错B:对

答案:对numpy库中使用的ndarray数组要求数据类型必须一致。()

A:错B:对

答案:错设数组a=np.arange(6).reshape(3,2),则表达式a[::-1]的作用是翻转数组a的两列。()

A:对B:错

答案:对计算数据之间的相关性,可以使用numpy库的corrcoef函数。()

A:对B:错

答案:对使用numpy库random子模块的randint函数每次只能生成一个随机整数。()

A:对B:错

答案:错使用numpy库的amax函数可以对多维数组的每一行求最大值。()

A:错B:对

答案:对在计算机上使用数值近似解方法解决实际问题时,不可避免地会引入误差,其主要来源类型有()。

A:舍入误差B:观测误差C:截断误差D:模型误差

答案:舍入误差;观测误差;截断误差;模型误差对Numpy库的描述,以下正确的是()。

A:是Python的外部扩展库B:其核心功能的实现受ndarray对象的支持C:是基于Python环境的科学计算基础包D:只支持数值类型的运算

答案:是Python的外部扩展库;其核心功能的实现受ndarray对象的支持;是基于Python环境的科学计算基础包对Numpy库中ndarray对象的描述,以下说法正确的是()。

A:元素可使用下标索引方式访问B:是一个多维数组C:对象中每个元素的存储空间大小相同D:对象中元素的数据类型必须相同

答案:元素可使用下标索引方式访问;是一个多维数组;对象中每个元素的存储空间大小相同使用Numpy库可以创建单位矩阵形式数组的函数有()。

A:eyeB:identityC:zerosD:ones

答案:eye;identity可以创建三角矩阵的Numpy库函数有()。

A:diagB:triuC:trilD:tri

答案:triu;tril;tri在numpy环境中执行语句序列a=np.array([1,2,3]);b=np.unique(np.append(a,2))后,以下说法正确的是()。

A:数组a和b是同一个数组B:数组b的内容为array([1,2,3])C:数组a和b的内容相同D:数组a的内容没有改变

答案:数组b的内容为array([1,2,3]);数组a和b的内容相同;数组a的内容没有改变将二维数组转换为一维数组,可以使用的方法有()。

A:numpy.flattenB:ndarray.reshapeC:numpy.ravelD:ndarray.resize

答案:ndarray.reshape;numpy.ravel;ndarray.resize使用numpy创建数组a=np.random.randint(1,10,[3,3]),则执行语句b=a[:,::-1]后,以下说法正确的是()。

A:数组a中的元素按行倒置后得到数组bB:数组a和b的形状相同C:数组a中的元素按列倒置后得到数组bD:数组a的内容保持不变

答案:数组a和b的形状相同;数组a中的元素按列倒置后得到数组b;数组a的内容保持不变Numpy库提供了线性代数子模块linalg,支持的运算包括()。

A:求解线性方程组B:矩阵和矢量的基本运算C:矩阵的分解和规范化D:求解矩阵的特征值

答案:求解线性方程组;矩阵和矢量的基本运算;矩阵的分解和规范化;求解矩阵的特征值常用的矩阵分解方法包括()。

A:QR分解B:正交分解C:三角分解(LU)D:奇异值分解(SVD)

答案:QR分解;三角分解(LU);奇异值分解(SVD)使用索引访问数组中的元素时,索引的形式可以是()。

A:切片索引B:整数数组索引C:布尔数组索引D:字段名称索引

答案:切片索引;整数数组索引;布尔数组索引;字段名称索引设arr是一个3行3列的numpy数值型数组,则以下操作返回原始对象视图的有()。

A:arr.view()B:arr+2C:arr.flatten()D:arr[:]

答案:arr.view();arr[:]以下属于numpy库子模块的有()。

A:maB:randomC:matlibD:linalg

答案:ma;random;matlib;linalgnumpy库中的linalg子模块可以用来()。

A:求解线性方程组B:计算两个矩阵的乘法C:求两个向量的欧式距离D:计算矩阵的行列式

答案:求解线性方程组;计算两个矩阵的乘法;求两个向量的欧式距离;计算矩阵的行列式使用numbers=np.random.uniform(0,20,20)语句创建一个numpy数组,要提取该数组中的整数部分,以下方法正确的是()。

A:numbers.astype(int)B:np.trunc(numbers)C:numbers-numbers%1D:np.floor(numbers)

答案:numbers.astype(int);np.trunc(numbers);numbers-numbers%1;np.floor(numbers)

第四章单元测试

对pandas库的描述,以下说法错误的是()。

A:是Python的外部扩展库,需要预先下载和安装B:只支持一维和二维的数据处理分析C:非常适合于关系型和标记型数据的处理和分析D:是一种高效且功能强大的数据分析包

答案:只支持一维和二维的数据处理分析关于DataFrame对象的描述,以下不正确的是()。

A:存储异构数据B:等价于二维的ndarray对象C:对象大小可变D:元素值可变

答案:等价于二维的ndarray对象关于Series对象的描述,以下不正确的是()。

A:对象中的元素值是可变的B:是一个带标签的一维数组C:对象中的数据是均匀的D:对象的大小是可变的

答案:对象的大小是可变的DataFrame对象使用一种行列交叉的表格结构,则以下描述不正确的是()。

A:每一行和列都具有相应的标签作为标识B:行和列允许增加或删除C:缺省情况下,默认的行、列标识都从0开始D:每一列允许使用不同的数据类型

答案:每一列允许使用不同的数据类型假设执行s=pd.Series(np.random.randn(5))语句,已经创建了一个Series对象,则以下允许的操作有()。

A:执行s.index=list("abcde"),改变对象的索引标识B:执行s[:]=s[:]+1,修改所有元素的值C:执行s.size=6,改变对象的大小D:执行s[0]=True,同时修改元素的值和数据类型

答案:执行s.size=6,改变对象的大小创建Series对象时,不可以作为其输入数据的是()。

A:标量值,如数字3B:Python的字典对象C:Python的集合对象D:numpy的ndarray对象

答案:Python的集合对象若DataFrame对象是一个由10行4列组成的数值型数据集,则要使用DataFrame对象的sum函数统计每一行的总和,应设置参数()。

A:axis=FalseB:axis=TrueC:axis=1D:axis=0

答案:axis=1设df是一个由100行5列组成的DataFrame对象,其中第5列标识为“Species”,数据类型是字符串型,要统计该列中每个字符串的长度,以下表达式正确的是()。

A:df["species"].count()B:map(lambdas:len(s),df["species"])C:len(df["species"])D:df["species"].map(lambdas:len(s))

答案:df["species"].map(lambdas:len(s))假设一个DataFrame对象df的第1列标识为“Species”,由不同物种名称的字符串组成,要统计该列中不同类别物种的个数,以下表达式正确的是()。

A:count(df["species"].unique())B:df["species"].count().unique()C:df.value_counts("species").unique()D:len(df["species"].unique())

答案:len(df["species"].unique())假设df为已经创建的DataFrame对象,且其列标识分别为“A”、“B”、“C”、“D”,则语句df.sort_values(by=["B","D"])的作用是()。

A:先按B列降序排序,B列相同时再按D列降序排序B:分别按B列、D列降序排序C:先按B列升序排序,B列相同时再按D列升序排序D:分别按B列、D列升序排序

答案:先按B列升序排序,B列相同时再按D列升序排序在进行数据预处理时,可以被pandas理解为缺失值的有()。

A:Python内置的NoneB:其余选项都是C:numpy模块提供的nanD:pandas模块提供的NaN

答案:其余选项都是若DataFrame对象df中存在重复数据,执行该对象的drop_duplicates方法,则以下说法不正确的是()。

A:只能删除df中行完全重复的所有数据B:删除重复数据后,行索引保持不变C:可以删除df中指定列完全重复的所有数据D:可以将df中所有的重复数据真正删除

答案:只能删除df中行完全重复的所有数据若DataFrame对象df存储的数据集中存在不同程度的缺失值NaN,则执行该对象的dropna方法删除这些缺失值时,以下说法正确的是()。

A:若参数axis=1且每列都存在缺失值,df将成为一个空的DataFrame对象B:若参数axis=0,只要某行中存在缺失值,该行数据将被全部删除C:若参数axis=0且每行都存在缺失值,df将成为一个空的DataFrame对象D:对象df中的原数据会始终保持不变

答案:对象df中的原数据会始终保持不变使用3σ原则检测数据集中的异常值时,其中的σ是指()。

A:标准差B:极差C:方差D:均值

答案:标准差以下属于二进制文件格式的有()。

A:XMLB:JSONC:TXTD:MSEXCEL

答案:MSEXCEL在pandas库与时间相关的类中,带有时区信息,表示某个具体时间点的类是()。

A:DatetimeB:TimedeltaC:TimestampD:Period

答案:Timestamp在时间序列的处理和分析中,目前不考虑时区因素而作为国际通用时间标准的是()。

A:DSTB:UTCC:GMTD:EST

答案:UTC在Python环境中,汇编世界时区信息,且封装在pandas库中,为时区信息的使用带来极大便利的第三方库是()。

A:datetimeB:PyTimeC:pytzD:Dateutil

答案:pytz数据分类是有效提高大数据集分析时空效率的必要手段,则以下关于数据分类的说法不正确的是()。

A:数据分类的时间代价较大时,分类是不必要的B:分类数据通常用整数编码C:对分类数据的操作速度会更快D:分类数据通常占用更少的内存

答案:数据分类的时间代价较大时,分类是不必要的使用DataFrame对象的sort_values方法对其中存储的数据进行排序时,以下允许的操作是()

A:设置要排序的轴向B:设置要排序的顺序C:设置要排序的列名D:设置要排序的索引标识

答案:设置要排序的索引标识使用DataFrame对象的concat()方法,可以将两个数据集合并成一个数据集。()

A:对B:错

答案:错使用DataFrame对象的groupby()方法对数据进行分组得到的GroupBy对象包含所有分组计算的结果。()

A:错B:对

答案:错使用Pandas的read_json()函数,在读取JSON格式文件的同时,可以解析文件中的数据内容。()

A:错B:对

答案:对FuzzyWuzzy是Python环境下对字符串模糊匹配的第三方库,它默认使用Python的标准库difflib进行字符串匹配。()

A:对B:错

答案:对对数据进行标准差标准化后,数据的值限定在[0,1]之间。()

A:对B:错

答案:错使用层次化索引可以在低维上访问到DataFrame对象的高维元素。()

A:错B:对

答案:对numpy库提供的Series对象即使只有一个轴,也能使用分层索引。()

A:对B:错

答案:对使用DataFrame对象的unstack()方法,可以将其中的行转换为列,得到一个具有多层索引的Series对象。()

A:错B:对

答案:错若两个数据子集的列数分别为n1、n2,则使用Pandas的merge方法按主键合并这两个数据子集时,合并后的结果数据集中的列数为n1+n2。()

A:对B:错

答案:错可以将numpy的ndarray数组对象转换为pandas的Series对象。()

A:错B:对

答案:对使用DataFrame对象的head方法,仅能查看数据集中前5行的数据。()

A:对B:错

答案:错可以通过对DataFrame对象的shape属性重新赋值的方式改变其形状。()

A:错B:对

答案:错使用DataFrame对象的reindex方法重构索引时,若该对象中原来没有索引标识“h”,则索引“h”对应的行将填充为NaN。()

A:错B:对

答案:对使用DataFrame对象的iloc方法选取行数据时,只能使用整数形式的索引标识。()

A:对B:错

答案:对Python的外部扩展库pandas不具有图表绘制的功能。()

A:对B:错

答案:错在使用DataFrame对象的groupby方法进行分组计算时,若分组键是列标识的列表,则分组的结果会以层次化索引表示和存储。()

A:错B:对

答案:对JSON格式的数据是以键-值对形式存储的序列化文本类型数据,可以使用pandas库的read_json和to_json方法读写。()

A:对B:错

答案:对如果数据集中表示日期时间的数据是一个很大的整数,一般是指在内部从新纪元Epoch开始的秒数。()

A:对B:错

答案:对在表示时间序列的频率中,WOM-3FRI表示每月第3个星期五。()

A:对B:错

答案:对以协调世界时UTC形式表示的时间戳值是带有时区信息的,在进行运算时需要进行时区的转换。()

A:对B:错

答案:错创建pandas库的Series对象时,以下可以作为其数据参数的有:()

A:tuple(1,2,3,4)B:range(4)C:{'a':1,'b':2,'c':3,'d':4}D:list("abcd")

答案:range(4);{'a':1,'b':2,'c':3,'d':4};list("abcd")假设已经创建列标识分别为“A”、“B”、“C”、“D”共4列的DataFrame对象df,则以下语句中能够同时访问C列、D列所有数据的是()

A:df.loc[:,['C','D']]B:df.iloc[:,[2,3]]C:df[['C','D']]D:df.iloc[:,2:3]

答案:df.loc[:,['C','D']];df.iloc[:,[2,3]];df[['C','D']]执行语句序列data=[[4,5,6],[4,5,6],[4,5,6]];df=pd.DataFrame(data,columns=list("ABC"))创建DataFrame对象df,则以下可以将df中值为5的数据修改为数值10的语句是()。

A:df[df.values==5]=10B:df["B"]=10C:df.loc[:,"B"]=5D:df.replace(5,10,inplace=True)

答案:df[df.values==5]=10;df["B"]=10;df.loc[:,"B"]=5;df.replace(5,10,inplace=True)使用pandas库可以直接读取的外部文件格式包括()。

A:CSV格式文件B:HTML格式文件C:XML格式文件D:Excel格式文件

答案:CSV格式文件;HTML格式文件;XML格式文件;Excel格式文件在pandas环境中对数据进行聚合,DataFrame对象的groupby方法是一种常用的形式,则以下相关说法正确的是()。

A:分组生成的GroupBy对象包含数据分组的所有信息B:一般遵循拆分、应用、合并的过程C:分组后的结果可以直接显示查看D:函数作为分组键时,函数的返回值作为分组的名称

答案:分组生成的GroupBy对象包含数据分组的所有信息;一般遵循拆分、应用、合并的过程;函数作为分组键时,函数的返回值作为分组的名称对时间序列数据的重采样,以下说法正确的是()。

A:本质上是频率转换的过程B:升采样时会产生大量的缺失值C:降采样时一般要进行相应的聚合运算D:对以日期为索引的时间序列升采样时目标频率必须是源频率的超时期

答案:本质上是频率转换的过程;升采样时会产生大量的缺失值;降采样时一般要进行相应的聚合运算在进行时间序列分析时,以时间顺序排列构成的观测样本序列数据集,一般具有的基本特性包括()。

A:随机性B:趋势性C:周期性D:季节性变化

答案:随机性;趋势性;周期性;季节性变化对时间序列的分析和预测,可以通过移动窗口并在窗口上进行统计计算的方式。Pandas应用于移动窗口计算的常用函数有()。

A:expandingB:shiftC:ewmD:rolling

答案:expanding;ewm;rolling在Pandas环境中使用分类数据,以下说法正确的是()。

A:可以人为指定分类数据的整数编码B:支持分类类型的底层算法采用整数编码数组,速度更快C:分类数据通常占用少的多的内存空间D:操作分类对象Categorical的方法是通过其cat属性提供的

答案:可以人为指定分类数据的整数编码;支持分类类型的底层算法采用整数编码数组,速度更快;分类数据通常占用少的多的内存空间;操作分类对象Categorical的方法是通过其cat属性提供的在Python环境中,可以使用链式编程思想的场景有()。

A:闭包函数的调用B:关系运算表达式C:自定义类成员方法的调用D:对数据集进行一系列变换

答案:闭包函数的调用;关系运算表达式;自定义类成员方法的调用;对数据集进行一系列变换在pandas的数据合并方法中,既可以按行合并,又可以按列合并的方法有()。

A:appendB:joinC:concatD:merge

答案:join;concat;merge以下属于pandas库自带的基本数据结构的是()。

A:ndarrayB:DataFrameC:listD:Series

答案:DataFrame;Series假设执行df=pd.DataFrame(np.random.randn(4,3),index=range(4),columns=["one","two","three"])语句已经正确创建了一个DataFrame对象,则以下允许的操作有()。

A:执行df.iloc[2]选择第三行B:执行df.index=list("abcd")改变对象的索引标识C:执行df["four"]=df["one"]+df["three"]添加一列D:执行df.pop("two")删除第二列

答案:执行df.iloc[2]选择第三行;执行df.index=list("abcd")改变对象的索引标识;执行df["four"]=df["one"]+df["three"]添加一列;执行df.pop("two")删除第二列使用DataFrame对象的describe方法,可以查看数据集的()。

A:每个数值列的数据项个数B:每行的最大值和最小值C:每个非数值列的类别数D:每个数值列的标准差

答案:每个数值列的数据项个数;每个非数值列的类别数;每个数值列的标准差使用DataFrame对象的groupby方法对数据进行分组后,得到一个GroupBy对象,则以下关于GroupBy对象的说法正确的是()。

A:是一个可迭代对象,由分组键值和对应的数据块组成B:可以通过该对象直接查看分组的结果C:该对象包含要进行分组计算的所有信息D:该对象包含对数值列的分组计算结果

答案:是一个可迭代对象,由分组键值和对应的数据块组成;该对象包含要进行分组计算的所有信息采用分组机制对数据进行计算时,以下对分组聚合和解封的说法正确的是()。

A:transform方法是对分组解封后的数据转换运算B:apply方法是在各个分组结果上的聚合运算C:可以直接在分组对象上执行统计计算D:只能对数据集中的数值型数据进行计算

答案:transform方法是对分组解封后的数据转换运算;apply方法是在各个分组结果上的聚合运算;可以直接在分组对象上执行统计计算;只能对数据集中的数值型数据进行计算在使用pandas库的get_dummies方法对分类特征进行哑变量处理以满足某些回归分析模型对数值型输入的要求时,以下说法正确的是()。

A:哑变量处理后的数据变得更加稀疏,因此降低了模型的运算速度B:get_dummies可以接收DataFrame对象的一列作为要处理的哑变量C:某一输入特征有n种分类时,可以设置n-1个哑变量D:哑变量的数值没有数量大小的意义,一般为0或1

答案:get_dummies可以接收DataFrame对象的一列作为要处理的哑变量;某一输入特征有n种分类时,可以设置n-1个哑变量;哑变量的数值没有数量大小的意义,一般为0或1在进行数据处理分析时,对数据进行离散化处理的原因主要有()。

A:减少数据量,降低算法的时空开销B:模型算法的要求C:提高算法对样本的抗噪声能力D:简化数据结构,更容易理解

答案:减少数据量,降低算法的时空开销;模型算法的要求;提高算法对样本的抗噪声能力;简化数据结构,更容易理解在进行数据的处理分析时,要求对原始数据进行标准化处理,其主要原因有()。

A:保证结果的可靠性B:保证算法的准确性C:消除数据特征之间量纲的差异D:消除评价指标之间的数量级差异

答案:保证结果的可靠性;消除数据特征之间量纲的差异;消除评价指标之间的数量级差异在pandas库的数据组织方式上,允许使用层次化索引,以使得在同一个轴上可以拥有多个索引级别,其主要原因有()。

A:更容易实现不同层次的数据交换和排序B:使得DataFrame对象可以存储和操作三维的数据C:能够以低维方式处理高维数据D:数据子集的选取和访问更加简单

答案:更容易实现不同层次的数据交换和排序;使得DataFrame对象可以存储和操作三维的数据;能够以低维方式处理高维数据;数据子集的选取和访问更加简单

第五章单元测试

Matplotlib库中用于实现绘图功能的最主要模块是()。

A:styleB:animationC:figureD:pylot

答案:pylot使用matplotlib库绘制图表时,关于画布和坐标轴,即figure对象和axes对象的描述,以下不正确的是()。

A:调用plot方法绘制图形时,会自动创建一个figure对象和一个axes对象B:一个axes对象只能在一个figure对象中使用C:在同一个figure对象上绘制的多个图形只能共用一个axes对象D:一个figure对象可以包含多个axes对象

答案:在同一个figure对象上绘制的多个图形只能共用一个axes对象为保证数据集中的数据点值能够在坐标轴上全部画出,使得坐标轴的大小适应数据的显示,可以使用Matplotlib库绘图模块的()函数实现。

A:plotB:autoscaleC:set_axesD:axis

答案:autoscale使用matplotlib库绘制图表,要在图表中添加注解,应调用pyplot模块的()方法来实现。

A:annotateB:plotC:legendD:figure

答案:annotate使用matplotlib.pyplot模块的subplot方法在画布上绘制子图时,在调用subplot(2,1,1)之后,若再调用subplot(2,3,4),则创建的子图是()。

A:第2行的第2个子图B:第2行的第3个子图C:第2行的第1个子图D:第2行的第4个子图

答案:第2行的第1个子图使用matplotlib.pyplot模块绘制柱形图和直方图时,以下说法不正确的是()。

A:柱形图中只有柱子的高度有意义B:绘制柱形图和直方图时,柱子的宽度均可以不同C:直方图中用柱子的宽度和高度均有意义D:柱形图和直方图所表示的数据均应具有连续性

答案:柱形图和直方图所表示的数据均应具有连续性制作词云图时,以下可以用来分词的模块是()。

A:echartsB:WordCloudC:jiebaD:wordcloud2

答案:jieba绘制三维线框图,可以使用mplot3d模块的()方法。

A:plotB:plot3dC:plot_wireframeD:plot3d_wireframe

答案:plot_wireframe使用Axes3D对象的bar3d(x,y,z,dx,dy,dz)函数绘制三维柱状图时,其中的参数x、y和z表示()。

A:柱子的体积B:柱子的大小C:柱子的形状D:柱子锚点的坐标

答案:柱子锚点的坐标三翼面图的绘制,可以使用Axes3D对象的()函数。

A:plot_trisurfB:plot_surfaceC:plot_wireframeD:contourf

答案:plot_trisurf使用matplotlib库绘制图表时,若要将y轴的刻度设置为对数形式,应使用坐标轴对象axes的方法是()。

A:set_ylabelB:set_yscaleC:set_yticksD:set_title

答案:set_yscale使用绘图模块pyplot的bar方法绘制柱形图时,要在同一个绘图区上绘制多个柱形图,且保证这些柱形图不重叠,正确的做法是()。

A:设置不同的x坐标位置B:同时调整柱形图的宽度和x轴上的坐标位置C:设置柱子具有不同的宽度D:设置柱子不同的对齐方式

答案:同时调整柱形图的宽度和x轴上的坐标位置使用绘图模块pyplot的hist方法绘制直方图时,参数histtype用来设置要绘制的直方图类型,其值不可以设置为()。

A:stepB:barplotC:stepfilledD:barstacked

答案:barplot使用pyplot模块的legend方法在绘图区添加图例时,参数loc用来指定图例框的位置,其取值有()种可能。

A:11B:8C:10D:9

答案:10对常用的二维图表,以下说法不正确的是()。

A:直方图既能表现分组的大小,又能表现各分组的频率高低B:饼图用来表现特征的占比情况,且对数量的比较更容易辨识C:柱状图只能在一个维度上进行比较D:散点图可以用来推断数据特征之间的相关性

答案:饼图用来表现特征的占比情况,且对数量的比较更容易辨识matplotlib是可以直接在Python环境中使用的标准库,无须事先安装。()

A:错B:对

答案:错在使用matplotlib.pyplot模块中的plot()函数绘制折线图时,matplotlib会自动创建一个绘图区(figure)。()

A:错B:对

答案:对堆积图可以表示不同部分对总量的数量贡献,只能表现事物的总体趋势。()

A:对B:错

答案:错散点图可以用来判断不同数据集之间是否存在相关性。()

A:对B:错

答案:对使用matpotlib.pyplot模块的xcorr方法绘制互相关图时,会通过numpy库的correlate函数自动计算数据之间的相关性。()

A:错B:对

答案:对自相关图可以用来表现同一个数据集在不同时间周期内的相似度。()

A:错B:对

答案:对使用matplotlib.animation模块的FuncAnimation类绘制动画时,每一帧的绘制都需要回调创建构成帧的绘图对象函数。()

A:错B:对

答案:对使用matplotlib.animation模块的ArtistAnimation类绘制动画时,必须预先创建构成动画的每一帧图像。()

A:错B:对

答案:对OpenGL是一种开放式图形库,独立于硬件和操作系统平台。()

A:错B:对

答案:对NetworkX库提供了网络的可视化功能,因此使用NetworkX库绘制网络图时,不需要导入matplotlib库的绘图模块pyplot。()

A:错B:对

答案:错PyLab模块不属于matplotlib库,它能够单独导入到Python环境并实现基本图表的绘制。()

A:对B:错

答案:对使用matplotlib库既可以在平面直角坐标系下绘图,又可以在极坐标系下绘图。()

A:对B:错

答案:对mplot3d是专门用来绘制三维图形的工具包,可以使用frommatplotlibimportmplot3d语句导入到Python环境。()

A:对B:错

答案:错animation模块是属于matplotlib库的一个子模块,可以使用frommatplotlibimportanimation语句导入到Python,并使用其中的接口类生成动画。()

A:对B:错

答案:对散点图可以用于表示三维特征的分布情况。()

A:对B:错

答案:对以下属于图表基本组成的有()。

A:图例B:图表标题C:坐标轴D:绘图区

答案:图例;图表标题;坐标轴;绘图区第三方库jieba为在Python环境中完成词云图的制作提供了必要的前提,其主要功能包括()。

A:以不同模式对文本进行分词B:对分词结果进行词频统计C:子模块analyse可以进行关键词提取D:子模块posseg可以进行词性分析

答案:以不同模式对文本进行分词;子模块analyse可以进行关键词提取;子模块posseg可以进行词性分析在matplotlib的pyplot模块中,可以用来创建图表中的子区的方法有()。

A:subplotB

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论