




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
数据分析技术习题及参考答案一、单选题(共40题,每题1分,共40分)1、下列的数组统计计算中,用于计算数组中最大值的方法是()。A、minB、maxC、maximalD、maximum正确答案:B2、在创建Figure对象时,可以指定哪个参数来给画布添加背景颜色?()A、facecolorB、numC、dpiD、figsize正确答案:A3、在NumPy通用函数中,用于计算元素级最大值的函数是()。A、maxB、maximalC、maximumD、min正确答案:C4、关于异常值的说法,下列选项中描述错误的是()。A、异常值是指样本中明显偏离其余观测值的个别值B、可以使用3σ原则检测异常值C、可以使用Pandas中的箱线图检测异常值D、异常值可以使用其它的值来替换正确答案:A5、关于分组聚合过程的说法中,下列描述不正确的是()。A、应用是指将某个函数或方法应用到每个分组B、拆分是指将数据集按照一些标准拆分为若干个组C、只能对纵轴方向上的数据进行分组D、合并是指将产生的新值整合到结果对象中正确答案:C6、请阅读下列一段程序:arr=np.arange(12).reshape(3,4)arr.shape运行上述程序,它最终执行的结果为()。A、(3,4)B、4C、3D、(1,2)正确答案:A7、下列关于Pandas库的说法中正确的是()。A、Pandas中只有两种数据结构B、Pandas不支持读取文本数据C、Pandas是在NumPy基础上建立的新程序库D、Pandas中Series和DataFrame可以解决数据分析中一切的问题正确答案:C8、下列关于数据预处理的说法中,描述不正确的是()。A、数据清洗的目的是为了提高数据质量B、异常值不一定要删除C、通过drop_duplicates()方法可以删除重复数据D、concat()函数可以根据一个或多个键将不同的DataFrame进行合并正确答案:D9、下列选项中,关于drop_duplicates()方法描述错误的是()。A、仅支持单一特征数据的去重B、仅对Series和DataFrame对象有效C、数据去重时默认保留第一个数据D、该方法不会改变原始数据排列正确答案:A10、关于Pandas数据读写的说法中,下列描述错误的是()。A、read_csv()能够读取所有文本数据B、read_sql()可以读取数据库中的数据C、to_csv()能够将结构化数据写入到csv文件中D、to_excel()能够将结构化数据写入到excel文件中正确答案:A11、请阅读下面一段程序:importnumpyasnpnp.arange(1,10,3)运行程序,最终执行的结果是()。A、array([2,5,8])B、array([1,4,7])C、array([3,6,9])D、array([1,4,7,10])正确答案:B12、请看如下代码:importnumpyasnparr=np.array([[6,2,7],[3,6,2],[4,3,2]]arr.sort()arr对代码中的NumPy数组执行sort()方法结果正确的是()。A、[[267][236]]B、[[267][632]]C、[[762][236]]D、[[762][632]]正确答案:A13、请阅读下面一段程序:importpandasaspdser_obj=pd.Series(range(1,6),index=[5,3,1,3,2])print(ser_obj)执行上述程序后,最终输出的结果为()。A、c1d2a3B、a3.0d2.0c1.0bNaNC、a3.0bNaNc1.0d2.0D、程序出现异常正确答案:C14、下列选项中,关于dropna()方法描述正确的是()。A、dropna()方法会删除值为None和NaN的数据B、dropna()方法只会删除值为NaN的数据C、dropna()方法只会检测缺失数据和空值D、dropna()方法不会删除值为None的数据正确答案:A15、下列图表中,可以清晰地反映出数据变化趋势的是()。A、饼图B、折线图C、散点图D、直方图正确答案:B16、下列选项中不属于Seaborn中分类数据可视化库的是()。A、分类数据的直方图B、分类数据的统计估算图C、分类数据的分布图D、分类数据散点图正确答案:A17、下列选项中,用来表示矢量化三元表达式的是()。A、sort()B、unique()C、cumsum()D、where()正确答案:D18、以下关于Pandas数据转换的说法中正确的是()。A、Pandas中只能重命名列索引的名称B、Pandas不支持重命名轴索引C、哑变量处理就是将分类变量转换为哑变量矩阵D、Pandas通过cut()函数能够实现哑变量操作正确答案:C19、下列方法中,可以将元组转换为MultiIndex对象的是()。A、from_tuples()B、from_product()C、from_list()D、from_arrays()正确答案:A20、下列关于ndarray对象索引的描述错误的是()。A、ndarray对象的多维数组索引和切片的使用方式与列表的使用方式完全相同B、花式索引是将整数数组或列表进行索引,然后将数组或列表中的每个元素作为下标进行取值C、布尔索引是将一个布尔数组做为数组索引,返回的数据是布尔数组中True对应位置的值D、ndarray对象中的元素可以通过索引和切片来访问和修改正确答案:A21、请阅读下面的程序:frompandasimportSeriesimportpandasaspdfromnumpyimportNaNseries_obj=Series([2,1,NaN])print(pd.isnull(series_obj))执行上述程序后,最终输出的结果为()。A、0False1False2FalseB、0True1True2TrueC、0True1True2FalseD、0False1False2True正确答案:D22、关于agg()方法的用法中,下列描述错误的是()。A、可以对一列数据应用不同的函数B、可以对不同的列使用不同的函数C、可以对每列数据应用同一个函数D、每列的数据只能使用相同的函数正确答案:D23、下列函数中,用于计算对角线元素和的是()。A、diag()B、dot()C、det()D、trace()正确答案:D24、下列选项中,用于绘制双变量分布的函数是()A、displot()B、pairplot()C、boxplot()D、joinplot()正确答案:D25、请阅读下列一段示例程序:arr2d=np.array([[11,20,5],[21,15,26],[17,8,19]])arr2d[0:2,0:2]运行上述程序,它最终执行的结果为()。A、array([11,20])B、array([11,21])C、array([21,15])D、array([[11,20],[21,15]])正确答案:D26、下列选项中,用来表示时间序列中的频率为每周六的是(),A、WOM-2MONB、W-FRIC、W-SUND、W-SAT正确答案:D27、下列函数中,可以设置当前图形x轴范围的是()。A、title()B、legend()C、xlim()D、xlabel()正确答案:C28、关于ndarray对象属性,下列描述错误的是()。A、dtype属性表示数组中元素类型的对象B、shape属性表示每个维度上数组的大小C、ndim属性表示数组轴的个数D、size属性表示数组元素的总个数,等于shape属性元组元素的和正确答案:D29、通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定起始日期?()A、freqB、periodsC、endD、start正确答案:D30、通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定终止日期?()A、freqB、periodsC、endD、start正确答案:C31、请阅读下面一段程序:importpandasaspdser_obj=pd.Series([1,2,3,],index=['c','d','a'])ser_obj2=ser_obj.reindex(['a','b','c','d'])print(ser_obj2)执行上述程序后,最终的结果为()。A、a1.0b2.0c3.0dNaNB、aNaNb1.0c2.0d3.0C、c1.0d2.0a3.0D、a3.0bNaNc1.0d2.0正确答案:D32、下列pyplot模块的函数中,可以绘制条形图的是()。A、hist()B、scatter()C、pie()D、bar()正确答案:D33、关于transform()方法的说法中,下列描述错误的是()。A、transform()方法可以使用广播B、使用transform()方法可以返回一个与分组大小相等的数组C、transform()方法只能使用内置方法对数据进行转换操作D、transform()方法对DataFrame和Series都适用正确答案:C34、下列选项中,可以一次性创建多个子图的是()。A、add_subplot()B、subplots()C、subplot()D、figure()正确答案:B35、请阅读下面一段程序:period=pd.Period(""2011-01"")other_period=pd.Period(""2012/06"")print(period-other_period)运行上述程序,它最终输出的结果为()。A、18B、-17C、-18D、17正确答案:B36、通过date_range()函数创建DatetimeIndex对象时,可以设置哪个参数指定产生多少个时间戳索引值?()A、freqB、periodsC、endD、start正确答案:B37、关于Anconda组件的说法中,下列描述错误的是()。A、AnacondaPrompt是Anaconda自带的命令行B、JupyterNotebook是基于客户端的交互式计算环境,可以编辑易于人们阅读的文档,用于展示数据分析的过程C、Spyder是一个使用Python语言、跨平台的、科学运算集成开发环境D、AnacondaNavigator是用于管理工具包和环境的图形用户界面,后续涉及的众多管理命令也可以在Navigator中手动实现正确答案:B38、下列函数中,用于保存当前生成的图表的是()。A、savefig()B、show()C、figure()D、hist()正确答案:A39、下列选项中,用于绘制单变量分布的函数是()。A、boxplot()B、pairplot()C、joinplot()D、displot()正确答案:D40、创建一个DatetimeIndex对象的代码如下:pd.date_range('2018/08/10','2018/08/15')默认情况下,该对象中时间戳的频率为()。A、HB、DC、SD、T正确答案:B二、判断题(共50题,每题1分,共50分)1、创建数组时可以不指定数据的类型。A、正确B、错误正确答案:A2、如果希望时间序列中的时间戳不再是固定的每天,则可以在创建DatetimeIndex时对freq参数进行修改。A、正确B、错误正确答案:A3、具有多层索引的DataFrame对象经过stack()重塑后,返回的是一个Series对象。A、正确B、错误正确答案:B4、创建时间序列时,如果起始时间或结束时间中带有与时间有关的信息,则会保留时间信息。A、正确B、错误正确答案:A5、我们可以调用new()函数构建一张新的空白画布。A、正确B、错误正确答案:B6、read_html()函数可以读取网页中所有的数据。A、正确B、错误正确答案:B7、GroupBy对象支持迭代。A、正确B、错误正确答案:A8、通过empty()函数创建的数组中所有元素值都是NaN。A、正确B、错误正确答案:B9、非平稳的时间序列需要通过差分预算来转变为平稳的时间序列。A、正确B、错误正确答案:A10、直方图可以利用方块的高度来反映数据的差异。A、正确B、错误正确答案:A11、sort()方法可以对任何轴上的数据进行排序A、正确B、错误正确答案:A12、如果要卸载指定环境中的包,则直接使用remove命令移除即可。A、正确B、错误正确答案:A13、通过zeros()函数创建的数组中元素值都是0。A、正确B、错误正确答案:A14、Anconda是完全免费的。A、正确B、错误正确答案:A15、如果希望一次性创建一组子图,则可以通过subplot()函数进行实现。A、正确B、错误正确答案:B16、使用字典做为分组键时,字典的键必须和数据中的列名相映射。A、正确B、错误正确答案:A17、Matplotlib是一个用在Python中绘制数组的3D图形库。A、正确B、错误正确答案:B18、agg()方法可以使用用户自定义的函数。A、正确B、错误正确答案:A19、在操作时间戳索引时,可以直接使用任何日期字符串来选取子集。A、正确B、错误正确答案:B20、哑变量可以用来反映某个变量的不同类别。A、正确B、错误正确答案:A21、只要使用groupby()方法分组,就会产生一个DataFrameGroupby对象A、正确B、错误正确答案:B22、ndarray对象中的swapaxes()方法可以将两个轴进行转换。A、正确B、错误正确答案:A23、Anconda不支持Python2.x版本。A、正确B、错误正确答案:B24、只要当前的系统中安装了Anconda,则默认就已经拥有了JupyterNotebook,不需要再另行下载和安装。A、正确B、错误正确答案:A25、Pandas既可以按照索引排序也可以按照数据排序。A、正确B、错误正确答案:A26、Pandas是一个基于NumPy的数据分析包,它是为了解决数据分析任务而创建的。A、正确B、错误正确答案:A27、通过date_range()函数创建DatetimeIndex对象时,如果只是传入了开始日期或结束日期,则还需要用periods参数指定产生多少个时间戳。A、正确B、错误正确答案:A28、ndarray对象的数据类型可以通过type()方法进行转换。A、正确B、错误正确答案:B29、时间序列的基础频率后面还可以跟着一个日期偏移量。A、正确B、错误正确答案:A30、假设当前有一个3行3列的ndarray数组,如果想要获取第3行第2列的元素,可以使用ndarray[3,2]。A、正确B、错误正确答案:B31、groupby()方法不能使用函数做为分组键。A、正确B、错误正确答案:B32、散点图包含的数据点越少,比较的效果就会越好。A、正确B、错误正确答案:B33、起始日期与结束日期定义了时间序列索引的严格边界。A、正确B、错误正确答案:A34、在创建DatetimeIndex对象时,如果只是指定了开始日期与结束日期,则默认生成的时间戳是按小时计算的。A、正确B、错误正确答案:B35、join()方法可以使用左连接和右连接两种方式连接数据。A、正确B、错误正确答案:A36、conda是一个在Windows、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五年度保姆聘用家政服务合同细则
- 2025版公共区域深度保洁合同范本
- 二零二五年度办公室租赁合同含企业办公设备租赁
- 二零二五年度办公设备智能化解决方案开发合同范本
- 2025版测绘员保密协议范本下载
- 二零二五年度车管所车辆抵押贷款服务协议
- 二零二五年度环保型产品包装运输专项合同
- 二零二五年商业保洁临时工劳动合同示范文本
- 二零二五年度办公室租赁合同租赁费用调整与支付方式
- 2025版车库租赁与停车费用结算规范合同
- 电气改造施工方案
- RB/T 034-2020测量设备校准周期的确定和调整方法指南
- GB/T 9258.1-2000涂附磨具用磨料粒度分析第1部分:粒度组成
- GB/T 3304-1991中国各民族名称的罗马字母拼写法和代码
- GB/T 28733-2012固体生物质燃料全水分测定方法
- GB/T 1226-2017一般压力表
- GA 1517-2018金银珠宝营业场所安全防范要求
- 部编版二年级下册语文期末考试试卷质量分析
- 《铁路技术管理规程》(普速铁路部分)-14年新版
- 信息系统实施前现状和需求调研计划提纲共享
- 华北理工大学生物药剂学与药物动力学教案
评论
0/150
提交评论