《Python及数据分析》考试试题_第1页
《Python及数据分析》考试试题_第2页
《Python及数据分析》考试试题_第3页
《Python及数据分析》考试试题_第4页
《Python及数据分析》考试试题_第5页
免费预览已结束,剩余1页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《Python及数据分析》考试试题一、单选题(每题3分,共22题,共66分)1.Python安装扩展库常用的工具是()pip(正确答案)pynumcodelisp2.下列关于python的说法,正确的是()python3.x和python2.x完全兼容python3.x和python2.x的唯一区别是:print在python2.x中是输出语句,而在python3.x中是输出函数可以在同一台计算机上安装多个python版本(正确答案)在window平台上编写的python程序无法在linux平台上运行3.一般说,numpy-matplotlib-pandas是数据分析和展示的一条学习路径,哪个是对这三个库不正确的说明?()pandas仅支持一维和二维数据分析,多维数据分析要用numpy(正确答案)matplotlib支持多种数据展示,使用pyplot子库即可numpy底层采用C实现,因此,运行速度很快pandas也包含一些数据展示函数,可不用matplotlib4.哪个选项更能代表如下代码的运行结果?()

importnumpyasnp

x=np.array([[0,1,2,3,4],[9,8,7,6]])

x.dtype()

float32类型int32类型uint32类型object类型(正确答案)5.Python基本语法仅支持整数、浮点数和复数类型,numpy和pandas库则支持int64/int32/int16/int8等20余种数字类型,如下说法哪个不正确?()科学计算可能涉及很多数据,对存储和性能有较高要求,因此支持更多种数字类型numpy底层是C语言实现,因此,天然支持了多种数据类型在python中程序员必须精确指定数据类型(正确答案)对元素类型精确定义,有助于numpy和pandas库更合理优化存储空间6.如下哪个语句能够生成一个n*n的正方形矩阵,对角线值为1,其余位置值为0()np.zeros((n,n))np.eye(n)(正确答案)np.full((n,n),1)np.ones((n,n))7.哪个是下面代码的运行结果?()

importnumpyasnp

a=np.arange(12).reshape((3,4))

print(a.mean())[4,5,6,7]16.55.5(正确答案)[1.5,5.5,9.5]8.如下代码中plt的含义是什么?()

importmatplotlib.pyplotasplt别名(正确答案)类名函数名变量名9.阅读下面代码:

importmatplotlib.pyplotasplt

plt.plot([9,7,15,2,9])

plt.show()

其中,show()函数的作用是什么?()

显示所绘制的数据图(正确答案)存储所绘制的数据图缓存所绘制的数据图刷新所绘制的数据图10.阅读如下代码

importpandasaspd

a=pd.Series([9,8,7,6],index=['a','b','c','d'])

哪个是print(a.index)的结果?()

[9,8,7,6][‘a’,‘b’,‘c’,‘d’](‘a’,‘b’,‘c’,‘d’)Index([‘a’,‘b’,‘c’,‘d’])(正确答案)11.下列算法哪个不属于聚类算法?()K-Means(K均值)聚类GMM层次法朴素贝叶斯(正确答案)12.数据挖掘描述不正确的是()从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程称为数据挖掘和数据挖掘相关的名称有,知识发现、数据分析、数据融合、决策支持等数据挖掘的功能包括:概念描述、关联分析、分类与预测、聚类分析、趋势分析、孤立点分析以及偏差分析等数据挖掘过程不包括数据预处理,也不包括数据统计(正确答案)13.关于分类处理,下列说法不正确的是()分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法、粗糙集法和遗传算法等分类的过程包括2步:首先在已知训练数据集上,根据属性特征,为每一种类别找到一个合理的描述或模型,即分类规则;然后根据规则对新数据进行分类决策树分类是用样本的属性作为结点,用属性的取值作为分支的树结构。它是利用信息论原理对大量样本的属性进行分析和归纳而产生的决策树用于对新样本的分类,即通过决策树对新样本属性值的测试,从树的叶子结点开始,按照样本属性的取值,逐渐沿着决策树向上,直到树的根结点(正确答案)14.在数据预处理中,需要对数据进行填充。下列说法不正确的是()如果对于某一属性值,缺失的数据占比很小,比如一万条数据当中,缺失该属性的只有10条数据,那么我们可以简单去除这十条缺失数据如果某一属性值缺失非常多,比如一个公司网点分布的数据集,属性包含城市,经纬度,邮编,地址……邮编这个属性在一万个网点数据当中,九千多个都没有这个属性值,那么这个属性也就没有参考意义了,可以去除有些属性值缺失很多,但是可以依据其他属性值来填补的,例如用身份证号填充出生日期,根据经纬度范围填充城市等等按照时间序列排序的数据的一些缺失值不能用中位数来填充(正确答案)15.文本挖掘常用的分析技术不包括()文本结构分析文本关联分析文本分类和文本聚类文本OCR识别(正确答案)16.关于数据预处理,下列说法不正确的是()数据清洗:对数据进行随机采样,缩小数据样本以缩短数据挖掘时间(正确答案)数据集成:将多个数据源中的数据结合起来存放在一个一致的数据存储中。需要注意不同数据源的数据匹配问题、数值冲突问题和冗余问题等数据变换:将原始数据转换成为适合数据挖掘的形式。包括对数据的汇总、聚集、概化、规范化,还可能需要进行属性的重构数据归约:缩小数据的取值范围,使其更适合于数据挖掘算法的需要,并且能够得到和原始数据相同的分析结果17.下列哪项不属于数据平滑处理的方法()随机生成法(正确答案)平均值法边界值法中值法18.下列不属于数据规约方法的是()数据立方体聚集维归约数据压缩数据空值填充(正确答案)19.在数据挖掘算法中,关于聚类和分类,下列说法不正确的是()聚类要划分的类是未知的,分类则可按已知规则进行聚类是一种无指导学习,它

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论