数据应用开发与服务模拟考试测试预习题(Python)_第1页
数据应用开发与服务模拟考试测试预习题(Python)_第2页
数据应用开发与服务模拟考试测试预习题(Python)_第3页
数据应用开发与服务模拟考试测试预习题(Python)_第4页
数据应用开发与服务模拟考试测试预习题(Python)_第5页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据应用开发与服务模拟考试测试预习题(Python)一、单项选择题(每题3分,共12题,共36分)1.如果希望在一个程序中同时运行多个任务,那么较好的办法是:()A、使用多个进程B、使用多线程(正确答案)C、编写多个函数分别调用D、使用多个模块2.下列哪个正则表达式最能代表11位手机号码:()A、'\w{11}'B、'\d{11}'(正确答案)C、'\d'D、'\d[11]'3.当服务器处理请求出现错误时,向客户端返回的响应码以下列哪个数字开头?()A、1B、3C、4D、5(正确答案)4.Windows平台上,MongoDB自带的客户端命令行工具的名称是:()A、mongod.exeB、mongo.exe(正确答案)C、cli.exeD、mongodb.exe5.numpy中计算数组的有偏估计方差,使用下列哪个调用?()A、var(ddof=1)B、std(ddof=1)C、var(ddof=0)(正确答案)D、std(ddof=0)6.在多次调用train_test_split拆分同一个数据集时,如果希望每次拆分的结果都相同,应该采用下列那种方式:()A、使用numpy.random.seed设置固定的随机数种子B、使用random.seed设置固定的随机数种子C、设置random_state参数为固定的值(正确答案)D、无需进行额外处理7.假设【政治面貌】字段的取值有如下3种:党员、团员、群众。某个样本中该字段值为“团员”,则下列那种数值表述形式最能代表该字段值的OneHot形式?()A、2B、1,0,1C、0,1,0(正确答案)D、1.08.下列那种情况属于过拟合:()

A、

B、

C、

D、(正确答案)9.具有两个特征的线性回归模型判别式是下面哪一个:()

A、

B、(正确答案)

C、

D、10.Sigmoid激活函数的图像如下图的哪一个?()

A、(正确答案)

B、

C、

D、11.已知向量A(1,1,1,1)和向量B(3,3,3,1),则这两个向量之间的汉明距离是:()

A、B、6C、3(正确答案)D、212.假设词典(词汇表)中各个单词分别为:[arejobgoodpleasemakeyoupythonhowengineersoftware],共10个单词。则语句”howareyou”转换成词向量后,可用下列哪中方式表达?()A、[7,0,5]B、[1,0,0,0,0,1,0,1,0,0](正确答案)C、[0,5,7]D、[0,1,1,1,1,0,1,0,1,1]二、判断题(每题2分,共12题,共24分)1.创建了子线程对象实例后,子线程中的工作任务将立即自动运行。()A、正确B、错误(正确答案)2.在使用re模块进行文本匹配时,如果希望区分大小写,则可以指定re.I选项。()A、正确B、错误(正确答案)3.HTTPGET请求中能够向服务器提交的数据最多不能超过1024字节。()A、正确(正确答案)B、错误4.pymongo中的drop_database函数和drop函数的作用相同。()A、正确B、错误(正确答案)5.K近邻算法(KNN)不仅可以用来执行机器学习分类任务,也可以用于缺失值填补?()A、正确(正确答案)B、错误6.使用训练集训练模型,使用验证集可以选择最优的模型,并且给出最优模型的泛化性能。()A、正确B、错误(正确答案)7.如果某个文本字段的取值种类非常多,则在进行数值化转换时非常适合转成OneHot形式。()A、正确B、错误(正确答案)8.人工智能是机器学习的一个重要研究领域。()A、正确B、错误(正确答案)9.线性回归模型训练的目标,就是要使得判别式对给定训练样本拟合的结果,与其真实结果之间的误差最小。()A、正确(正确答案)B、错误10.逻辑回归只能处理二分类问题。()A、正确B、错误(正确答案)11.KNN模型中的K值,一般设置为经验值即可。()A、正确B、错误(正确答案)12.朴素贝叶斯中的“朴素”是指各个特征之间在概率上彼此独立,因此它们共同出现的概率就可以视为每个特征分别出现的概率之乘积。()A、正确(正确答案)B、错误三、多项选择题(每题4分,共10题,共40分)1.使用多线程有哪些好处?()A、程序运行得更快B、防止主线程被阻塞(正确答案)C、能够充分利用多核CPU(正确答案)D、能顾更好的保护共享数据2.下列哪些字符串匹配正则表达式'\d{3,4}-\d{7,8}':()A、(正确答案)B、(正确答案)C、'010-123456789'(正确答案)D、(正确答案)3.一个HTTP请求包含下列哪些内容?()A、请求方法(正确答案)B、请求地址(正确答案)C、请求头(正确答案)D、请求体(正确答案)4.pymongo中哪些函数可以用于向MongoDB集合中插入数据记录?()A、insert_one(正确答案)B、insert_many(正确答案)C、appendD、insert_into5.补全数据样本中空缺值的方法有哪些?()A、均值填补(正确答案)B、临近值填补(正确答案)C、众数填补(正确答案)D、插值(正确答案)6.现有1000个样本,采用5折交叉验证来优选模型。则下列说法正确的是:()A、共生成5组数据,每组数据中均包含训练集和验证集(正确答案)B、训练集和验证集的比例一般为4:1,但也可以指定不同的比例(正确答案)C、针对每组数据,使用训练集训练模型,使用验证集计算模型的性能指标(正确答案)D、统计5组数据的平均性能指标,并以它为选择最优模型的主要依据(正确答案)7.下列哪些函数可以将文本值转换成从0开始自增长的整数形式。()A、LabelEncoder(正确答案)B、pandas.Categorical(正确答案)C、OrdinalEncoder(正确答案)D、OneHotEncoder8.关于监督学习与非监督学习的说法,正确的是:()A、监督学习在模型训练过程中需要使用样本的标签(正确答案)B、非监督学习在模型训练过程中无需使用样本的标签(正确答案)C、监督学习往往需要人工事先标注大量的数据(正确答案)D、聚类是一种典型的非监督学习算法(正确答案)9.以下关于R方指标的说法,正确的是:()A、R方的值越接近0,模型效果越好B、在sklearn中,R方的取值范围在0到1之间(正确答案)C、R方用于评价回归模型的性能,不宜用于评价分类模型的性能(正

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论