版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第一章单元测试1【单选题】(10分)大数据的起源是()。A.金融B.公共管理C.互联网D.电信2【单选题】(10分)机器学习的实质是()。A.建立数据模型B.挑出输入数据和输出数据的最佳映射关系/函数C.根据现有数据,寻找输入数据和输出数据的映射关系/函数D.衡量输入数据和输出数据的映射关系/函数的好坏3【单选题】(10分)Spark支持的分布式部署方式中哪个是错误的()。A.standaloneB.sparkonYARNC.sparkonmesosD.Sparkonlocal4.【多选题】(10分)正确答案:ABCD以下表述正确的是:()A.机器学习指机器有学习的能力,是人类达成人工智能目标的手段。B.人或机器表现的很有智慧取决于先天本能/创造者事先设定的规则和后天学习。C.人工智能是人们长远以来的目标,期待机器像人一样有智慧。D.深度学习是机器学习的一种。5.【多选题】(10分)正确答案:ACD有效抑制机器学习过拟合的方法是()A.平滑损失函数。B.减少数据量。C.重新设计损失函数,引入平滑函数。D.加大数据量。6.【多选题】(10分)正确答案:ABCD下面表述正确的()A.强化学习指只有评价性输出结果的机器学习。B.监督学习指训练集中包括没有输出数据与之对应的输入数据,且所有输入数据属于同类别数据。C.迁移学习指训练集中包括没有输出数据与之对应的输入数据,但这些输入数据与其他输入数据不相干。D.监督学习指训练集所有输入数据都有相应输出数据与之对应。7.【多选题】(10分)正确答案:ABCD关于Spark中的RDD描述正确的()A.RDD(ResilientDistributedDatset)叫做弹性分布式数据集,是Spark中最基本的数据抽象。B.Resilient:表示弹性的,弹性表示。C.Destributed:分布式,可以并行在集群计算。D.Datset:就是一个集合,用于存放数据的。8【判断题】(10分大数据的定义是不唯一的,从不同的角度对大数据都会有不同的理解。()A.错B.对9【判断题】(10分关系抽取一般在实体抽取任务之后,用于抽取两个实体之间的句间关系。()A.错B.对10【判断题】(10分Spark的四大组件为SparkStreaming、Mlib、Graphx、SparkR。()A.对B.错第二章单元测试1【单选题】(10分)关于Python语言的变量,以下选项中说法正确的是()。A.随时命名、随时赋值、随时使用B.随时命名、随时赋值、随时变换类型C.随时声明、随时使用、随时释放D.随时声明、随时赋值、随时变换类型2【单选题】(10分)以下选项中,不是建立字典的方式是()。A.d={(1,2):1,(3,4):3}B.d={'张三':1,'李四':2}C.d={1:[1,2],3:[3,4]}D.d={[1,2]:1,[3,4]:3}3【单选题】(10分)下列说法中正确的是()。A.break用在for语句中,而continue用在while语句中B.break用在while语句中,而continue用在for语句中C.break能结束循环,而continue只能结束本次循环D.continue能结束循环,而break只能结束本次循环4【单选题】(10分)tuple(range(2,10,2))的返回结果为()。A.[2,4,6,8]B.[2,4,6,8,10]C.(2,4,6,8,10)D.(2,4,6,8)5【判断题】(10分Python列表中所有元素必须为相同类型的数据。()A.对B.错6【判断题】(10分在函数内部没有任何声明的情况下直接为某个变量赋值,这个变量一定是函数内部的局部变量。()A.错B.对7【判断题】(10分在定义函数时,某个参数名字前面带有两个*符号表示可变长度参数,可以接收任意多个关键参数并将其存放于一个字典之中。()A.错B.对8【判断题】(10分使用内置函数open()且以”w”模式打开的文件,文件指针默认指向文件尾。()A.对B.错9【单选题】(10分)下面代码的输出结果是()forsin"abc":foriinrange(3):print(s,end="")ifs=="c":breakA.aaabbbcccB.aaabcccC.abbbcccD.aaabbbc10【单选题】(10分)下面代码的输出结果是()x=10y=3print(x%y,x**y)A.130B.31000C.11000D.330第三章单元测试1【单选题】(10分)s=pd.Series(np.random.randint(59,100,5),index=list("ABCDE")),能够原地删除s[“A”]的操作是()。A.s.drop(labels="A")B.s.drop("A")C.pd.drop(s,labels="A")D.dels["A"]2【单选题】(10分)若有grouped_sc=df.groupby('学校'),则查询查看分组数量应采用()A.grouped_sc.size()。B.grouped_sc。C.grouped_sc.head()。D.grouped_sc.ngroups。3.【多选题】(20分)正确答案:ABCD下列方法中,能够利用pandas.DataFrame()创建DataFrame的是()。A.通过Python字典创建B.通过随机函数创建C.通过ndarray对象创建D.通过Series创建4.【多选题】(10分)正确答案:ACD关于缺失值填充函数pandas.DataFrame.fillna(),正确的说法是()。A.method参数为pad表示用缺失值前面的值对缺失值进行填充。B.inplace参数用于指示是否原地替换,默认为True。C.D.axis参数表示填充维度,确定从行开始或是从列开始。5.【多选题】(10分)正确答案:ABCDdf包含"计划销售额"和"实际销售额"两列数据,若要筛选未完成计划销售额但实际销售额不低于4000的所有月份信息,可用的方式有()。A.df[(df["计划销售额"]df["实际销售额"])&(df["实际销售额"].ge(4000))]。B.df.query("计划销售额实际销售额&实际销售额=4000")。C.df[(df["计划销售额"]df["实际销售额"])&(df["实际销售额"]=4000)]。D.df[(df["计划销售额"].gt(df["实际销售额"]))&(df["实际销售额"].ge(4000))]。6.【多选题】(10分)正确答案:BCD下列属于透视操作的是()。A.transformer()。B.pivot()。C.pivot_table()。D.crosstab()。7【判断题】(10分pandas读取csv文件时可使用usecols参数指定某个列作为索引。()A.错B.对8【判断题】(10分pandas.DataFrame.sum(axis=1)表示对每行数据求和。()A.对B.错9【判断题】(10分unstack()可将列旋转到行,从而将宽表变成长表。()A.错B.对第四章单元测试1【单选题】(10分)绘制折线图时用label参数可为图表添加图例,但必须与()配合使用。A.ticks()。B.label()。C.legend()。D.title()。2【单选题】(10分)关于注释的说法中,正确的是()。A.matplotlib对图表的注释分为静态文本注释和动画注释两种。B.matplotlib.pyplot.annotate()主要用于动画型注释。C.matplotlib.pyplot.annotate()的注释在静态图片中不可见。D.matplotlib.pyplot.text()主要用于无指向型注释。3【单选题】(10分)绘制折线图的函数是()。A.plot()。B.pie()。C.bar()。D.polar()。4【单选题】(10分)在绘制两组数据对比的柱形图时,若希望两组柱形并列显示,应通过调整()实现。A.参数x和bottom。B.参数x和width。C.参数x、width和bottom。D.参数height和width。5.【多选题】(10分)正确答案:ABD导入matplotlib的可行的做法是()A.importmatplotlib.pyplotasplt()。B.frommatplotlibinmportpyplot。C.importpyplotasplt。D.importmatplotlib.pyplot。6.【多选题】(10分)正确答案:ABC关于雷达图绘制,正确说法的有()。A.直接使用polar()绘图时需使用np.concatenate()使数据闭合。B.xticks()可用来设置弧度信息。C.使用polar()绘制极坐标系,然后用plot()绘制雷达图时无需闭合数据。D.xticks()可用来设置半径信息。7.【多选题】(10分)正确答案:CD关于箱线图绘制,正确说法的有()。A.参数vert用于指示是否需要将箱线图垂直摆放,默认为水平放置。B.参数notch用于指示是否以凹口的形式展现箱线图,默认为凹口。C.参数sym用于指定异常点的形状,默认为+号显示。D.参数whis用于指定上下须与上下四分位的距离,默认为1.5倍的四分位差。8【判断题】(10分fontdict是用来设置字体属性的字典型参数。()A.对B.错9【判断题】(10分bar()函数可通过参数bottom选择水平/垂直的柱形条的绘制方式。()A.对B.错10【判断题】(10分气泡图本质上仍属于散点图。()A.错B.对第五章单元测试1【单选题】(20分)两个变量y与x的回归模型中,通常用R方来刻画回归效果,则正确的叙述是()。A.R方越小,残差平方和小。B.R方越小,残差平方和大。C.R方越大,残差平方和大。D.R方与残差平方和无关。2【单选题】(20分)如果拟合曲线几乎通过了所有实测数据点,很有可能出现的现象是()。A.过拟合。B.不确定。C.欠拟合。D.正常拟合。3【单选题】(20分)以下()是线性回归方程参数求解常用的方法。A.牛顿法。B.梯度下降法。C.穷举法。D.插值法。4【单选题】(10分)线性回归模型中的损失函数用来估量预测值与()的差异程度。A.真实值。B.个体值。C.平均值。D.零值。5【判断题】(10分与梯度下降法相比,当输入变量k较大时,正规方程法求解参数的速度要更慢。()A.错B.对6【判断题】(10分梯度下降法需要选择学习率,需要多次迭代求解参数。()A.错B.对7.【多选题】(10分)正确答案:ABDA.B.C.D.第六章单元测试1【单选题】(10分)有关聚类分析说法错误的是()。A.聚类分析无法提取样本特征B.聚类分析簇间数据具有较大的差异性C.聚类分析可以分析样本的分布特点D.无需对样本进行标记2.【多选题】(10分)正确答案:ABD下面算法中,算法分析是建立在凸球形的样本空间的是()。A.凝聚聚类算法B.K中心点算法C.DBSCAND.K-means3【判断题】(10分轮廓系数只能用于K-means算法的评估。()A.错B.对4【判断题】(10分DBSCAN算法对参数敏感。()A.对B.错5【判断题】(10分凝聚聚类分析是一种自底向上的聚类分析算法。()A.对B.错6.【多选题】(10分)正确答案:BCD关于K-means聚类说法正确的是()。A.K-means的聚类中心一定是样本空间的数据B.K-means需要事先指定K的数目C.K-means的聚类中心是聚类中心的均值D.K-means实现采用的是贪心策略7【判断题】(10分K中心点算法是异常值敏感的聚类算法。()A.错B.对8【判断题】(10分K-means算法是异常值敏感的聚类算法。()A.错B.对9【单选题】(10分)下面哪一个算法不是聚类分析算法()A.KNNB.DBSCANC.K中心点算法D.K-means10【单选题】(10分)聚类分析的相似性度量方法,以下哪种方法只考虑了变量之间的方向()A.B.C.D.第七章单元测试1【单选题】(20分)Logistic回归分析属于()回归A.非概率型非线性回归B.非概率型线性回归C.概率型线性回归D.概率型非线性回归2【单选题】(20分)C4.5决策树构造算法的特征选择采用()A.基尼系数B.信息增益C.条件熵D.信息熵3.【多选题】(20分)正确答案:ABD关于朴素贝叶斯分类器,正确的有()A.利用贝叶斯公式将样本属于某个类别的概率转换为后验概率来计算B.是一种概率分类器C.所谓“朴素”假设,即是样本独立同分布的假设D.所谓“朴素”假设,即是样本特征(属性)的条件独立假设4【单选题】(20分)支持向量机SVM算法采用的损失函数是()A.都可以B.指数损失函数C.铰链损失函数D.Logistic损失函数5.【多选题】(20分)正确答案:BCD支持向量机分类器求解方法有()A.所有选项都不是B.随机梯度下降C.序列最小优化D.内点法第八章单元测试1【单选题】(20分)以下关于Boosting和Bagging说法正确的是()。A.Bagging是序列集成方法B.Bagging可以用来减小方差C.AdaBoost是经典的Bagging算法D.Boosting可以用来减小方差。2【单选题】(20分)一般情况,在个体学习器性能相差较大时宜使用()结合策略。A.学习法B.加权平均法C.投票法D.集成法3【判断题】(20分集成方法是并行集成方法。()A.对B.错4【判断题】(20分集成学习只对大规模的数据集有较好的策略。()A.错B.对5.【多选题】(20分)正确答案:ABCD以下哪些方法可以减少过拟合()A.增加更
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024至2030年中国长青瓜行业投资前景及策略咨询研究报告
- 2024至2030年中国煤饼箱数据监测研究报告
- 2024至2030年中国智能型无线报警器行业投资前景及策略咨询研究报告
- 2024至2030年小圆皮套钟项目投资价值分析报告
- 2024年非公路矿用车项目申请报告
- 2024年果蔬设备项目提案报告
- 2024年重型机床项目申请报告
- 2024年有色金属合金:铝合金项目申请报告
- 2024年度二手家具买卖与搬运服务合同2篇
- 2024年真空绝热板项目提案报告模板
- 小学科学教育科学六年级上册能量神奇的小电动机习题
- 金融工程学(第五版)第6章商品价格风险管理
- 体育学科案例分析题答题思路一
- Q∕SY 1583-2013 二元复合驱用表面活性剂技术规范
- 期中表彰大会方案
- 2022年三临床路径及单病种档案盒
- 大洋环流重点
- 国际航班保障流程
- 《有机合成》说播课课件(全国高中化学优质课大赛获奖案例)
- 高中地理经纬网PPT通用课件
- 城市景观生态
评论
0/150
提交评论