数据分析及应用模拟习题及答案_第1页
数据分析及应用模拟习题及答案_第2页
数据分析及应用模拟习题及答案_第3页
数据分析及应用模拟习题及答案_第4页
数据分析及应用模拟习题及答案_第5页
已阅读5页,还剩33页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据分析及应用模拟习题及答案一、单选题(共41题,每题1分,共41分)1.有个苦逼的上班族,他每天忘记定闹钟的概率为0.2,上班堵车的概率为0.5,如果他既没定闹钟上班又堵车那他迟到的概率为1.0,如果他定了闹钟但是上班堵车那他迟到的概率为0.8,如果他没定闹钟但是上班不堵车他迟到的概率为0.9,如果他既定了闹钟上班又不堵车那他迟到的概率为0.0,那么求出他在60天里上班迟到的期望。A、A30.6B、B40.1C、C25.8D、D36.8正确答案:A2.Python定义私有变量得方式是?A、A使用__private关键字B、B使用public关键字C、C使用__xxx__定义变量名D、D使用__xxx定义变量名正确答案:D3.以下两种描述分别对应哪两种对分类算法的评价标准?()(a)警察抓小偷,描述警察抓的人中有多少个是小偷的标准。(b)描述有多少比例的小偷给警察抓了的标准。A、APrecision,RecallB、BRecall,PrecisionC、CPrecision,ROCD、DRecall,ROC正确答案:A4.定义矩阵,输出结果是()in_arr=[2,0,-2,-5]out_arr=np.fabs(in_arr)print(out_arr)A、A6B、B8C、C7D、D不可能有这样的树正确答案:C5.循环队列的存储空间为Q(1:100),初始状态为front=rear=100。经过一系列正常的入队与退队操作后,front=rear=99,则循环队列中的元素个数为______。A、A0或100B、B1C、C2D、D99正确答案:A6.将一颗骰子投掷两次,依次记录点数,两数之差绝对值为1的概率()A、A0.1B、B0.2C、C0.3D、D0.4正确答案:A7.箱线图boxplot()函数,设置中位数的属性,如线的类型、粗细等的参数是()A、AmeanpropsB、BmedianpropsC、ClabelsD、Dboxprops正确答案:B8.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?A、A第一个B、B第二个C、C第三个D、D第四个正确答案:B9.Python语言属于()。A、A机器语言B、B汇编语言C、C高级语言D、D科学计算语言正确答案:C10.标有不同编号的红色球和白色球各四个,任取两个红色球和一个白色球,共有()种不同的取法A、A10B、B15C、C20D、D24正确答案:D11.用importmatplotlib.pyplotaspt引入pyplot模块后,下面可以对执行的代码是()A、A按位取反B、B按位异或C、C按位与D、D左移一个字节正确答案:A12.程序测试的目的是______。A、A为被测程序设计正确的测试用例B、B发现并改正程序中的错误C、C发现程序中的错误D、D改正程序中的错误正确答案:C13.软件按功能可以分为应用软件、系统软件和支撑软件(或工具软件)。下面属于应用软件的是______。A、A学生成绩管理系统B、BC语言编译程序C、CUNIX操作系统D、D数据库管理系统正确答案:A14.采用分治法计算最大子段和时间复杂度为()A、AO(log(n))B、BO(nlog(n))C、CO(n^2)D、DO(n)正确答案:B15.模糊判决可以采用不同的方法,其中包括重心法、最大隶属度方法、加权平均法。若得到的模糊输出为F=0.1/2+0.9/3+0.3/7+0.4/9,当采用最大隶属度方法时,应该取结论为()。A、A3B、B7C、C9D、D2正确答案:A16.在长度为n的顺序表中查找一个元素,假设需要查找的元素有一半的机会在表中,并且如果元素在表中,则出现在表中每个位置上的可能性是相同的。则在平均情况下需要比较的次数大约为______。A、A3n/4B、BnC、Cn/2D、Dn/4正确答案:A17.fractions模块中Fraction类用于构造(?)类型数据。A、A双精度小数B、B分数C、C复数D、D根式正确答案:B18.网络报文记录及分析装置告警信息可以按照多种方式进行分类,其中不包含下列哪种方式()A、A网络B、BIEDC、C时间段D、D模型正确答案:D19.软件按功能可分为应用软件、系统软件和支撑软件(或工具软件)。下面属于应用软件的是______。A、A编译程序B、BAndroid操作系统C、C汇编程序D、D财务报表统计正确答案:D20.OTSU算法遍历可能的阀值,并且选取前景区域和背景区域A、A绝对差B、B面积差C、C像素值累积差值D、D类间方差正确答案:D21.下面选项中t不是s的子序列的是()A、As=t=B、Bs=t=C、Cs=t=D、Ds=t=正确答案:C22.以下代码执行的输出结果为:()importnumpyasnparr=np.array([[1,2,3,4,5],[6,7,8,9,10]])print(arr[0:2,1:4])A、A[[234][789]]B、B[[123][678]]C、C[234789]D、D[123678]正确答案:A23.下列选项中,不属于ndarray对象属性的是A、AshapeB、BdtypeC、CndimD、Dmap正确答案:D24.关于异常值的说法,下列选项中描述错误的是A、A异常值是指样本中明显偏离其余观测值的个别值B、B可以使用3σ原则检测异常值C、C可以使用Pandas中的箱线图检测异常值D、D异常值可以使用其它的值来替换正确答案:A25.实现最长公共子序列利用的算法是()A、A分治策略B、B动态规划法C、C贪心法D、D回溯法正确答案:B26.以下哪个不是python关键字()A、AfinalB、BassertC、CnotD、Dwith正确答案:A27.下面描述中正确的是______。A、A集成测试是为了发现详细设计的错误B、B集成测试是为了发现概要设计的错误C、C集成测试是为了发现需求分析的错误D、D集成测试是为了发现编码的错误正确答案:B28.已知df为DataFrame对象,请通过计算将Calories列的中值替换任何空值A、Adf[Calories"].fillna(df["Calories"].median(),inplace=True)"B、Bdf[Calories"].fillna(df["Calories"].mid(),inplace=True)"C、Cdf[Calories"].fillna(df["Calories"].mid(),inplace=NaN)"D、Ddf[Calories"].fillna(df["Calories"].median(),inplace=NaN)"正确答案:A29.假设d:\pythonscore.csv文件内容如下:张三,80,90李四,95,100则执行以下代码后,变量s的值应该为()importcsvs=0withopen(""d:\python\score.csv"",r)astxl:r=csv.reader(txl)forxinr:s=s+int(x[2])#类切片A、ANoneB、Ba""C、C抛异常D、D[456]正确答案:B30.对于j=10,foriinrange(j)循环内执行语句j-=1,那么该循环将执行(?)次。A、A10B、B7C、C6D、D程序报错正确答案:A31.循环队列的存储空间为Q(1:50)。经过一系列正常的入队与退队操作后,front=rear=25。后又成功地将一个元素入队,此时队列中的元素个数为______。A、A50B、B1C、C26D、D2正确答案:B32.求解斐波那契数列第n项的算法最小的时间复杂度为()。A、AO(N!)B、BO(N^N)C、CO(N)D、DO(LogN)正确答案:D33.pow(2,2,3)返回值为()。A、A64B、B64.0C、C1D、D1.0正确答案:C34.代码print(‘’\n’’)的执行结果是()A、A’\n’B、B’\\n\’C、C‘\’\\n\’\nD、D报错正确答案:A35.将3个不一样的球随机放入4个杯子中,则杯子中球的最大个数为2的概率是?A、A9/16B、B3/4C、C3/8D、D3/16正确答案:A36.关于哑变量的说法中,下列选项描述错误的是A、A哑变量是人为虚设的变量B、B哑变量在转换成指标矩阵后,其值通常为0或1C、CPnadas中get_dummies()函数可以对类别进行哑变量处理D、D哑变量的使用没有实际意义正确答案:D37.假设有命令importnumpyasnpArray1=np.linspace(1,5,3,dtype=int)print(Array1)则,执行结果是A、A30B、B20C、C[[710][1522]]D、D[[58][1522]]正确答案:A38.假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?()A、AraiseB、BwithC、CimportD、Dfinal正确答案:D39.输入若已经是排好序的(递增),下列排序算法(同样递增)最快的是()A、A插入排序B、BShell排序C、C合并排序D、D快速排序正确答案:A40.循环语句foriinrange(-3,21-4)的循环次数为A、A0B、B6C、C7D、D8正确答案:B41.对软件系统结构图描述正确的是______。A、A原子模块是位于中间结点的模块B、B扇出是调用一个给定模块的模块数C、C结构图是描述软件系统功能的D、D深度越深宽度越宽说明系统越复杂正确答案:D二、多选题(共38题,每题1分,共38分)1.Python中,对于字典dict1={a:one,b:two,c:four};dict2={c:three,d:1},以下选项中正确的操作有()纠错收藏A、Adict1.update(dict2)B、Bdict1.get(a)C、Cdict1.pop(c)D、Ddict1.clear()正确答案:ABCD2.Python中,对于字典dict1={a:one,b:two,c:four};dict2={c:three,d:1},以下选项中正确的操作有()A、Adict1.update(dict2)B、Bdict1.get(a)C、Cdict1.pop(c)D、Ddict1.clear()正确答案:ABCD3.下列选项中,哪项是可以用于数据采集的技术?A、AFlumeB、BHiveC、CKafkaD、DMahout正确答案:AC4.UNIX/Linux系统中的Apache服务器的主要安全缺陷表现在攻击者可以()A、A利用HTTP协议进行的拒绝服务攻击B、B发动缓冲区溢出攻击C、C获得root权限D、D利用MDAC组件存在一个漏洞,可以导致攻击者远程执行目标系统的命令正确答案:ABC5.有字符串s=TarenaPython,下列正确并且结果非空的是?()纠错收藏A、As[2]="R"B、Bs[-5:-2:-1]C、Cs+"AI"+sD、Ds[-5:-2:]正确答案:CD6.在系统工程的视角来看待各个项目和其中关键环节索要解决的问题,是需要有系统思维来处理的,主要包括(),不能够一撮而就。纠错收藏A、A需求分析并完成概要设计(辨别真需求而不是想象中的需求)B、B根据方案意见反馈进行系统详细设计(不考虑应用场景的规划设计最终都没法达到理想的技术应用效果)C、C实现方案实施和效果评价(要先有冒烟的试用环节和效果评价,AI技术是有用的工具但不是万能良药)D、D交付运行并要跟踪问题(用户真心说好才是好,同时积累经验给下一个任务使用)正确答案:ABCD7.下列选项中不符合Python语言变量命名规则的是:()纠错收藏A、ATempStrB、B*IC、C3_1D、D’-AI正确答案:BCD8.下列属于Anaconda主要特点的是()纠错收藏A、A包含了众多流行的科学、数学、工程、数据分析的Python包B、B完全开源和免费C、C支持Python2.6、2.7、3.4、3.5、3.6,可自由切换D、D额外的加速和优化是免费的正确答案:ABC9.衡量一个算法好坏的标准不包含()纠错收藏A、A运行速度快B、B占用空间少C、C时间复杂度低D、D代码短正确答案:ABD10.关于递归函数的描述,以下选项中不正确的是()A、A包含一个循环结构B、B函数比较复杂C、C函数内部包含对本函数的再次调用D、D函数名称作为返回值正确答案:ABD11.决定人工神经网络性能的要素有()。纠错收藏A、A神经元的特性B、B神经元之间相互连接的形式为拓扑结构C、C为适应环境而改善性能的学习规则D、D数据量大小正确答案:ABC12.下列选项中,人工智能的基础实现有?纠错收藏A、A机器学习B、B深度学习C、CBP神经网络D、D卷积神经网络正确答案:ABCD13.关于数据维度的描述,正确的是:()纠错收藏A、A一维数据采用线性方式组织,对应于数组概念B、B二维数据有关联关系构成,采用表格方式组织C、C高维数据由键值对类型的数据组成,采用对象方式组织D、D一维数据是由对等关系的有序数据构成,无序数据不是一维数据正确答案:ABC14.决定人工神经网络性能的要素有()。A、A神经元的特性B、B神经元之间相互连接的形式为拓扑结构C、C为适应环境而改善性能的学习规则D、D数据量大小正确答案:ABC15.Pandas函数包含下面那几种?纠错收藏A、AMemory_usageB、BInfer_objectsC、CExplodeD、DMelt正确答案:ABCD16.人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得哪些知识?纠错收藏A、A计算机知识B、B心理学C、C哲学D、D文学正确答案:ABC17.下面说法正确的是()。纠错收藏A、A算法原地工作的含义是指不需要任何额外的辅助空间B、B在相同的规模n下,复杂度O(n)的算法在时间上总是优于复杂度O(2n)的算法C、C所谓时间复杂度是指最坏情况下,估算算法执行时间的一个上界D、D同一个算法,实现语言的级别越高,执行效率就越低正确答案:BCD18.使用python语言编程时可以通过(?)添加注释。纠错收藏A、A。。。B、B#C、C//D、D/*…*/正确答案:AB19.Numpy库中生成基夫分布的随机数组,2行3列,以下代码不正确的是:()A、Ax=random.normal(size=(2,3))B、Bx=random.zipf(a=2,size=(2,3))C、Cx=random.uniform(size=(2,3))D、Dx=random.rayleigh(scale=2,size=(2,3))正确答案:ACD20.下列选项中,哪项是可以用于数据采集的技术?纠错收藏A、AFlumeB、BHiveC、CKafkaD、DMahout正确答案:AC21.Python中,for...in循环能遍历的类型是()纠错收藏A、A字典B、B列表C、C浮点数D、D字符串正确答案:ABD22.以下选项属于Python哲学内容的是()。A、A简单胜过复杂B、B单纯不如冗余C、C扁平胜于嵌套D、D优美胜于丑陋正确答案:ACD23.Numpy库中生成泊松分布的随机数组,1行10个元素,不正确的代码是:()A、Ax=random.multinomial(n=10,pvals=[1/6,1/6,1/6,1/6,1/6,1/6])B、Bx=random.poisson(lam=3,size=10)C、Cx=random.chisquare(df=2,size=10))D、Dx=random.logistic(loc=1,scale=2,size=10)正确答案:ACD24.机器学习的实现过程,包括数据收集、()等环节。纠错收藏A、A数据分析处理B、B算法选择C、C训练模型D、D模型调整正确答案:ABCD25.下列说法正确的是()A、A算法原地工作的含义是指不需要任何额外的辅助空间B、B在相同的规模n下,复杂度O(n)的算法在时间上总是优于复杂度O(2n)的算法C、C所谓时间复杂度是指最坏情况下,估算算法执行时间的一个上界D、D同一个算法,实现语言的级别越高,执行效率就越低正确答案:BCD26.数据预处理方法主要有()。纠错收藏A、A数据清洗B、B数据集成C、C数据变换D、D数据归约正确答案:ABCD27.pandas库DataFrame能够删除对象的是()A、AdelB、BpopC、CdropD、Ddelete正确答案:ABC28.Numpy库中生成瑞利分布的随机数组,2行3列,以下代码不正确的是:()纠错收藏A、Ax=random.normal(size=(2,3))B、Bx=random.zipf(a=2,size=(2,3))C、Cx=random.chisquare(df=2,size=(2,3))D、Dx=random.rayleigh(scale=2,size=(2,3))正确答案:ABCD29.下面叙述错误的是()A、A算法的执行效率与数据的存储结构无关B、B算法的空间复杂度是指算法程序中指令(或语句)的条数C、C算法的有穷性是指算法必须能在执行有限个步骤之后终止D、D以上三种描述都不对正确答案:ABD30.Python语言的应用领域有()。纠错收藏A、AWeb开发B、B操作系统管理和服务器运维的自动化脚本C、C科学计算D、D游戏开发正确答案:ABCD31.以下选项属于Python哲学内容的是()。纠错收藏A、A简单胜过复杂B、B单纯不如冗余C、C扁平胜于嵌套D、D优美胜于丑陋正确答案:ACD32.以下是正确的字符串()纠错收藏A、A‘abc”ab”B、B‘abc”ab’C、C“abc”ab”D、D“abc\”ab”正确答案:BD33.下列关于数据分析流程的说法正确的是()纠错收藏A、A需求分析是数据分析最重要的一部分B、B数据预处理是能够建模的前提C、C分析与建模时只能够使用数值型数据D、D模型评价能够评价模型的优劣正确答案:ABD34.不能够用于处理两个向量的点积的函数是()纠错收藏A、Adot()B、Bvdot()C、Cinv()D、Dsolve()正确答案:ACD35.下面对count(),index(),find()方法描述错误的是()A、Acount()方法用于统计字符串里某个字符出现的次数B、Bfind()方法检测字符串中是否包含子字符串str如果包含子字符串返回开始的索引值,否则会报一个异常C、Cindex()方法检测字符串中是否包含子字符串str,如果str不在返回-1D、D以上都错误正确答案:BC36.下列代码中不能绘制散点图的是()。纠错收藏A、Aplt.scatter(x,y)B、Bplt.plot(x,y)C、Cplt.legend(upperleft)D、Dplt.xlabel(散点图)"正确答案:BCD37.下列说法正确的是()A、Aunion用于计算索引的交集B、Bisin用于数据是否包含在其中C、Cinsert函数可以插入索引D、Dunique用于计算索引中的唯一数组正确答案:ACD38.现阶段,作为AI技术和应用服务的推行者,我们需要具备()纠错收藏A、A对AI技术的鉴赏力,对于技术描述有清晰的判断和辨析,不人云亦云断章取义B、B对AI技术的理解力,主要判断在各个应用场景下技术的可行性,能做到还是不能做到,或是说需要如何结合人工才能形成人机协作解决问题的结果C、C对AI技术的应用力,践行去追求:让AI的应用有看得见摸得着的真实应用案例、有能够规模化和可推广的对应产品、可以通过统计数据去说明应用成效D、D对AI技术的夸张力,不管用户要求的任何场景任何问题,不用特别分析和定制,我们的AI系统都是最好的,用户的问题都是可以解决的正确答案:ABC三、判断题(共28题,每题1分,共28分)1.numpy数组的astype()方法不会改变原数组元素类型(?)。A、正确B、错误正确答案:A2.apply()方法可以使用广播功能。()A、正确B、错误正确答案:A3.numpy.in1d()函数测试一维数组的每个元素是否还存在于第二个数组中,并返回与第一个数组相同长度的布尔数组A、正确B、错误正确答案:A4.已知x为非空列表,那么x.sort(reverse=True)和x.reverse()的作用是等价的。A、正确B、错误正确答案:B5.栈和队列的都具有先入后出的特点。A、正确B、错误正确答案:B6.列表对象的extend()方法属于原地操作,调用前后列表对象的地址不变。A、正确B、错误正确答案:A7.Python字符串方法replace()对字符串进行原地修改。A、正确B、错误正确答案:B8.在Python中可以使用if作为变量名。A

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论