在线网课知道智慧《R语言数据分析与挖掘(中央财大)》单元测试考核答案_第1页
在线网课知道智慧《R语言数据分析与挖掘(中央财大)》单元测试考核答案_第2页
在线网课知道智慧《R语言数据分析与挖掘(中央财大)》单元测试考核答案_第3页
在线网课知道智慧《R语言数据分析与挖掘(中央财大)》单元测试考核答案_第4页
在线网课知道智慧《R语言数据分析与挖掘(中央财大)》单元测试考核答案_第5页
已阅读5页,还剩21页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章单元测试1【单选题】(1分)下面哪些是R可以存储的数据对象?()。A.数据框B.列表框C.矩阵D.其余选项都是2【单选题】(1分)关于attach()函数说法正确的是?()。A.把数据库加载到R的搜索空间B.其余选项均正确C.与detach()的功能不同D.执行attach()加载数据库后,可以直接访问该数据库中的一些对象3【单选题】(1分)下面哪些方式可以查看到帮助文档?()。A.help(mean)B.?meanC.?mean和help(mean)都正确D.?mean和help(mean)都不正确4【单选题】(1分)假设y<-c(1,2,3,-1,0,2),那么关于语句y[c(-2,-3)],说法正确的是___.()。A.该语句选取y的第2和第3个元素B.该语句存在语法错误C.执行该语句不会改变y的长度D.执行该语句将改变y的长度5【单选题】(1分)下面关于修改向量x<-c(1,2,-1,-3,-5)的说法错误的是___.()。A.执行语句x<-0后,x的值为0,0,0,0,0B.执行语句x[c(1,5)]<-0后,x的值为0,2,-1,-3,0C.执行语句x<-0后,x的值为0D.执行语句x[1]<-0后,x的值为0,2,-1,-3,-5第二章单元测试1【单选题】(1分)若从正态分布总体中抽样得到一组样本,样本的值为1,-1,2,3,4,5,1,2,4,3,那么样本的中位数为?()。A.2B.2.5C.3D.42【单选题】(1分)若从正态分布总体中抽样得到一组样本,样本的值为7,7,5,2,5,4,7,9,4,8,那么样本的众数为?()。A.4B.7C.5D.83【单选题】(1分)最大值与最小值之间的差值称为?()。A.方差B.极差C.四分位差D.范围4【单选题】(1分)关于变异系数的说法正确的是?()。A.变异系数越大,数据越分散B.其余选项都正确C.可以用样本的变异系数来比较多个样本的离散程度D.变异系数能够反映数据的离散程度5.【多选题】(1分)正确答案:ACD若从正态分布总体中抽样得到一组样本,样本的值为1,-1,2,3,4,5,1,2,4,3,4,4,那么下面哪些说法是正确的?.()。A.该样本只有一个众数B.该样本的标准差为3.16(只保留两位小数)C.若要计算该样本的中位数,需要先对其进行排序D.该样本的极差为6第三章单元测试1.【多选题】(1分)正确答案:CD分类变量用下面哪些图形来描述较为合适?()。A.箱线图B.直方图C.条形图D.饼图2.【多选题】(1分)正确答案:ACD分类变量用哪些统计量来描述较为合适?()。A.比率B.极差C.频数D.比例3.【多选题】(1分)正确答案:ACD下面哪些图形用来描述数值变量的分布情况更为恰当?()。A.箱线图B.折线图C.概率密度曲线D.直方图4.【多选题】(1分)正确答案:AB下面哪些说法是正确的?()。A.可以用点图展示数值变量的分布形状B.在对数值变量离散化处理的情况下,可以使用条形图展示数值变量的分布形状C.在不对数值变量进行任何处理的情况下,使用条形图展示数值变量的分布形状是恰当的D.点图不可以用来展示数值变量的分布形状5.【多选题】(1分)正确答案:ABC下面关于table()函数说法正确的是?()。A.table()函数能够用来制作一维列联表B.table()函数本质是实现分类变量的频数统计C.table()函数可以用来制作交叉表D.table()函数不能用来制作三维及以上的列联表6.【多选题】(1分)正确答案:ABD下面哪些图形用来描述分类变量的分布情况更为恰当?()。A.饼图B.柱状图C.散点图D.扇形图7【单选题】(1分)下面哪些图形用来描述分类变量与分类变量的关系更为恰当?()。A.重叠直方图B.散点图C.箱线图D.并排柱状图8【单选题】(1分)下面哪些图形用来描述分类变量与数值变量的关系更为恰当?()。A.箱线图B.重叠扇形图C.散点图D.并排柱状图9【单选题】(1分)下面哪些图形用来描述数值变量与数值变量的关系更为恰当?()。A.箱线图B.并排柱状图C.重叠扇形图D.散点图10【单选题】(1分)下面哪些图形用来描述三个数值变量之间的关系更为恰当?()。A.柱状图B.直方图C.气泡图D.箱线图第四章单元测试1【判断题】(1分合并连接是把两个表格组合在一起的数据操作方式.()。A.错B.对2【判断题】(1分主键是数据表中观测样本的唯一标识.()。A.错B.对3【判断题】(1分外键是另外一个数据表中观测样本的唯一标识.()。A.对B.错4【判断题】(1分内连接是一种最简单的连接,内连接匹配两个数据表中键值相等的观测样本.()。A.对B.错5【判断题】(1分外连接包括:内连接、左连接、右连接、全连接.()。A.对B.错第五章单元测试1【判断题】(1分当两事件A和B互斥时,P(A∪B)有可能大于P(A)+P(B).()。A.对B.错2【判断题】(1分设某地有甲乙两种报纸,该地成年人中有30%读甲报纸,15%读乙报纸,10%两种报纸都读,则成年人中有5%至少读一种报纸.()。A.错B.对3【判断题】(1分设有1000件产品,其中850件是正品,150件是次品,从中依次抽取2件,2件都是次品的概率是0.025.()。A.对B.错4【判断题】(1分随机变量可分为连续型随机变量和离散型随机变量.()。A.对B.错5【判断题】(1分设X~N(0,1),则P(X<1.5)<0.9.()。A.错B.对第六章单元测试1【判断题】(1分设从一个均值μ=10、标准差σ=0.6的总体中随机选取容量为n=36的样本。假定总体不是很偏,则样本均值在总体均值附近0.1范围内的近似概率大于0.7.()。A.对B.错2【判断题】(1分设X~N(16,4),则10X~N(160,40).()。A.对B.错3【判断题】(1分假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025~0.070之间的概率大于20%.()。A.错B.对4【判断题】(1分卡方分布和t分布都是由正态分布导出的.()。A.对B.错5【判断题】(1分某汽车电瓶商声称其生产的电瓶具有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否准确,为此随机抽取了50个该厂生产的电瓶进行寿命实验。假设厂商声称是正确的,则50个电瓶的平均寿命的抽样分布为N(60,6).()。A.错B.对第七章单元测试1【单选题】(1分)关于置信区间的构造,正确的是.()。A.置信区间的宽度不会受到样本量的影响B.置信区间的宽度不会受到置信水平的影响C.置信区间的宽度会受到样本均值的影响D.置信区间的宽度会受到总体方差或样本方差的影响2【单选题】(1分)关于两个正态总体方差之比的置信区间,正确的是.()。A.置信区间有可能会包含0B.置信区间的宽度不会受到样本量的影响C.置信区间的形式为:点估计标准误D.置信区间不可能包含03【单选题】(1分)在构造总体均值的置信区间的过程中,首先需要确定分位数,关于分位数确定正确的是.()。A.分位数同时由样本量和总体方差是否已知决定B.分位数不由样本量和总体方差是否已知决定C.分位数只由总体方差是否已知决定D.分位数只由样本量决定4【单选题】(1分)关于两个总体均值之差的置信区间的形式说法正确的是.()。A.两个总体均值之差的点估计±标准误B.两个总体均值之差的点估计±标准差C.两个总体均值之差的点估计±分位数×标准误D.两个总体均值之差的点估计±分位数×标准差5【单选题】(1分)关于配对的两个总体均值之差的置信区间的说法正确的是.()。A.要对配对样本标准化,得到标准化序列B.要先对配对样本做差值,得到差值序列C.要先求各个样本的均值、标准差等统计量D.要先对配对样本求和,得到求和序列6【判断题】(1分矩估计和似然估计都可用来估计总体的未知参数.()。A.错B.对7【判断题】(1分无论样本量大小,样本比例的区间估计都是相同的.()。A.错B.对8【判断题】(1分假设X是来自正态总体的一个样本,在未知的情况下,的置信区间估计的结果都是相同的.()。A.对B.错9【判断题】(1分假设X和Y是分别来自正态总体的两个样本,总体均值都已知且相等,那么构成总体方差之比的置信区间的F分位数的第一自由度和第二自由度总是相等的.()。A.对B.错10【判断题】(1分标准误就是样本的标准差.()。A.错B.对第八章单元测试1【单选题】(1分)下面关于假设检验两类错误正确的是.()。C.第一类错误是为假,接受2【单选题】(1分)下面关于假设检验两类错误正确的是.()。A.降低两类错误的概率的方法是降低样本量B.降低第一类错误的概率,会增加犯第二类错误的概率C.降低第一类错误的概率,不会增加犯第二类错误的概率D.显著水平是第二类错误犯错的概率3【单选题】(1分)对于一个总体均值的假设检验,应该选用哪个统计量来检验(已知样本量大于50).()。A.Z统计量B.T统计量C.统计量D.F统计量4【单选题】(1分)假设X是来自正态总体N(μ,100)的一个样本,样本均值为4,样本量为25,对于假设检验:μ=5的检验统计量的值为?()。A.无法计算B.-0.5C.0.5D.-0.055【单选题】(1分)假设X是来自正态总体N(μ,100)的一个样本,样本均值为4,样本量为25,对于置信水平为0.05的假设检验:μ=5说法正确的是?已知(24)=-1.71。()。A.该检验是单侧检验B.接受原假设C.该检验应该构造Z统计量来检验D.拒绝原假设6【单选题】(1分)假设X是来自正态总体N(μ,)的一个样本,样本均值为16,样本量为1000,对于置信水平为0.05的假设检验:μ=16说法正确的是?()。A.该检验应该构造t统计量来检验B.该检验是单侧检验C.该检验应该构造F统计量来检验D.该检验应该构造Z统计量来检验7【单选题】(1分)假设X是来自正态总体N(μ,)的一个样本,样本方差为1,样本量为1000,对于置信水平为0.05的假设检验说法正确的是?()。A.该检验应该构造F统计量来检验B.该检验是双侧检验C.该检验的统计量可能会小于0D.该检验应该构造统计量来检验8【单选题】(1分)假设X和Y是分别来自正态总体的样本,样本量分别为1000和800,假设总体方差相等,对于置信水平为0.05的假设检验说法正确的是?()。A.该检验的统计量不可能会小于0B.该检验应该构造Z统计量来检验C.该检验应该构造t统计量来检验D.该检验是双侧检验9【单选题】(1分)假设X和Y是分别来自正态总体的样本,样本量分别为25和30,对于置信水平为0.05的假设检验说法正确的是?()。A.无需要做其他操作,可以直接用Z检验来检验B.检验前,要先检验方差是否相等C.检验前,不需要检验方差是否相等D.无需要做其他操作,可以直接用t检验来检验10【单选题】(1分)假设X和Y是分别来自正态总体的样本,样本量分别为未知,对于置信水平为0.05的假设检验说法正确的是?()。A.用F统计量检验,自由度分别为第九章单元测试1【判断题】(1分拟合优度检验用来判断各类别的观察频数与某一期望频数或理论频数是否一致.()。A.对B.错2【判断题】(1分在应用独立性检验时,要求样本量应足够大,特别是每个单元格的期望频数不能太小,否则会得出错误的结论.()。A.对B.错3【判断题】(1分拟合优度检验可以检验分类变量是否服从某种分布律分布.()。A.错B.对4【单选题】(1分)拟合优度检验又称为___.()。A.方差齐性检验B.分布检验C.一致性检验D.均值检验5【单选题】(1分)独立性检验(testofindependence)可以用来检验___.()。A.两个数值变量是否独立B.两个类别变量是否独立C.都不正确D.一个数值变量与一个类别变量是否独立第十章单元测试1【单选题】(1分)方差分析对数据分布的假设前提___.()。A.总体服从泊松分布B.总体服从正态分布C.总体服从均匀分布D.总体服从指数分布2【单选题】(1分)方差分析对各水平方差的假设条件应满足___.()。A.都不对B.方差相等C.方差可以相等,也可以不等D.方差不等3【单选题】(1分)设因素有k个水平,若每个水平的均值用表示,那么方差分析的原假设是___.()。A.H0:各水平的均值相等B.H0:自变量与因变量无关C.H0:各水平的均值相等和H0:自变量与因变量无关都可以D.H0:各水平的均值相等和H0:自变量与因变量无关都不可以4【单选题】(1分)检验因素各水平是否服从正态分布的方法有__.()。A.都可以B.Q-Q或P-P图C.K-S检验D.Shapiro-Wilk检验5【单选题】(1分)单因素方差分析的效应量反应___.()。A.误差平方和SSE与总平方和SST的比例B.处理效应平方和SSA与总平方和SST的比例C.总平方和SST与处理效应平方和的SSA比例D.总平方和SST与误差平方和SSE的比例6【判断题】(1分无论总体是否服从正态分布,都可以使用非参数方差分析方法来实现方差分析.()。A.错B.对7【判断题】(1分判断总体是否服从正态分布的方法除了图形法外,还可以使用检验的方法.()。A.错B.对8【判断题】(1分在方差分析中,效应量是指随机误差与总体误差之比.其值越大,拟合效果越差.()。A.对B.错9【判断题】(1分对于方差分析而言,要比较任意两个水平的均值是否相等,可以使用LSD多重比较或t检验.()。A.错B.对10【判断题】(1分方差分析是分析数值变量与分类变量之间关系的统计方法,可以在一个模型中包括任意多的分类变量.()。A.对B.错第十一章单元测试1【单选题】(1分)将因变量的值扩大10,将自变量的值同时扩大100,则___.()。A.斜率的估计值不变B.回归的不变C.OLS估计量的方差不变D.截距的估计值不变2【单选题】(1分)估计量具有抽样分布的原因是___.()。A.经济数据是不精确的B.在给定X的情况下,误差项的不同实现会导致Y的取值有所不同C.在现实数据中你往往会重复得到多组样本D.不同的人可能有不同的估计结果3【单选题】(1分)在其他因素相同的条件下,如果___,斜率估计量标准差较小.()。A.样本容量更小B.解释变量X有更多变差C.误差项的方差更大D.截距估计值更小4【单选题】(1分)误差项的异方差会影响OLS估计量的___.()。A.一致性B.线性性C.最优性D.无偏性5【单选题】(1分)如果一个假设在5%的显著水平下不能被拒绝,则它___.()。A.在1%的显著水平下可能被拒绝B.在10%的显著水平下一定被拒绝C.在10%的显著水平下一定不会被拒绝D.在1%的显著水平下一定不会被拒绝6.【多选题】(1分)正确答案:ABCD一元线性回归的基本假设有___.()。A.任意两个样本的随机误差相互独立B.随机误差的期望为0C.随机误差的方差相等D.随机变量X与Y之间存在线性关系7【单选题】(1分)若是一元线性回归方程的回归系数的最小二乘估计,那么下面说法正确的是___.()。A.它的方差为:B.的期望:C.它的估计值为:8.【多选题】(1分)正确答案:ABCD关于一元线性回归模型的残差项,说法正确的是___.()。9.【多选题】(1分)正确答案:AD若,是一元线性回归方程的回归系数的最小二乘估计,那么下面说法正确的是___.()。A.是截距项,它表示Y的平均水平B.是截距项,它表示X的平均水平C.表示,Y每变动一个单位,X变动个单位D.表示,X每变动一个单位,Y变动个单位10.【多选题】(1分)正确答案:BCD若是一元线性回归方程的回归系数的最小二乘估计,若X标准化和Y标准化后的向量为和,且一元线性回归方程为,那么下面说法正确的是___.()。A.B.回归方程穿过原点(0,0)C.D.11【判断题】(1分回归分析前,要先通过相关系数或散点图观察变量之间是否存在线性关系.()。A.错B.对12【判断题】(1分散点图也可以用来观察样本中是否存在离群点.()。A.错B.对13【判断题】(1分判别一元线性回归是否显著不仅可以使用t检验,也可以使用F检验.()。A.错B.对14【判断题】(1分在一元线性回归中,如果因变量与自变量存在明显的正相关关系,那么其回归系数将显著大于0()。A.错B.对15【判断题】(1分用于建立回归模型的样本是否独立不会影响OLS对回归系数的估计结果()。A.错B.对第十二章单元测试1【单选题】(1分)虚拟变量陷阱(dummyvariabletrap)是以下哪个情形?()。A.完全多重共线性B.仅仅是理论所关心的C.不完全多重共线性D.实际操作中不会发生的2【单选题】(1分)关于不完全共线性,如下哪个说法是正确的?()。A.即使样本容量n100,最小二乘估计量也是有偏的B.回归误差项是高度相关的C.无法计算最小二乘估计量D.两个或者多个自变量是高度相关的3【单选题】(1分)如果回归模型中遗漏了能够影响因变量的变量,会产生的后果是___.()。A.既然其他变量没有包括进来,所以当前模型的估计是正确的B.一定会使得当前模型的最小二乘估计量有偏C.如果遗漏的变量和现存的变量相关,会使得当前的最小二乘估计量有偏D.虽然无法度量出遗漏变量的作用,但是对模型中现存的变量进行估计不受影响4【单选题】(1分)如果模型有遗漏变量偏差,会使得哪一个最小二乘的假设条件不满足?.()。A.是独立同分布的B.C.模型不存在完全共线性D.模型是同方差的5【单选题】(1分)考虑有两个自变量X1和X2的回归模型,这两个自变量都是Y的影响因素。如果先使用X1对Y做回归,估计得到的回归系数很小,但是同时使用X1,X2做回归,发现X1前面的回归系数变大了很多。这意味的前面的一元线性回归存在___.()。A.异方差B.遗漏变量偏差C.完全共线性D.虚拟变量陷阱6【单选题】(1分)下述模型使用个人的收入和教育水平来解释个人的储蓄:其中变量Edu是一个二元变量,如果是受过高等教育的个体,Edu=1,否则Edu=0。请问该研究中,基准组是___.()。A.高收入群体B.未受过高等教育的群体C.低收入群体D.受过高等教育的群体7【单选题】(1分)下述模型使用个人的收入和教育水平来解释个人的储蓄:.其中变量Edu是一个二元变量,如果是受过高等教育的个体,Edu=1,否则Edu=0。如果,我们把该系数解释为___.()。A.收入水平较低的群体储蓄更高B.给定收入水平,受过高等教育的群体的平均储蓄比没受过高等教育的群体高个单位C.收入水平较高的群体储蓄更高D.给定收入水平,没受过高等教育的群体的平均储蓄比受过高等教育的群体高个单位8【判断题】(1分多重共线性会导致回归系数不显著、回归系数正负号颠倒等与常识违背的现象。()。A.错B.对9【判断题】(1分在多元回归分析中,回归系数可以直接用来评价自变量的重要性。()。A.错B.对10【判断题】(1分如果根据来选择变量并建立多元线性回归模型,那么我们可能会得到一个复杂的模型。()。A.错B.对第十三章单元测试1【单选题】(1分)Logistic回归与多重线性回归比较()A.多重线性回归的因变量为二分类变量B.多重线性回归的自变量必须为二分类变量C.Logistic回归的自变量必须为二分类变量D.Logistic回归的因变量为二分类变量2.【多选题】(1分)正确答案:BCDLogistic回归适用于因变量为()A.连续型定量变量B.二分类变量C.多分类有序变量D.多分类无序变量3【单选题】(1分)Logistic回归可用于()A.校正混杂因素B.预测C.均可D.影响因素分析4【判断题】(1分Logistic回归模型的参数估计为加权最小二乘估计。()A.对B.错5【判断题】(1分当因变量的取值在[0,1]变化,而自变量的取值范围超出了[0,1],甚至在整个实数轴上取值时,可以采用Logistic回归模型解决这个问题。()A.错B.对6【单选题】(1分)筛选危险因素常用的方法有()A.后退法B.都可C.前进法D.逐步法7【单选题】(1分)Logistic回归中自变量若为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用()A.软件自动筛选的后退法B.软件自动筛选的前进法C.软件自动筛选的逐步法D.应将几个哑变量作为一个因素,整体进入回归方程8【判断题】(1分为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,针对上述问题,可采用Logistic回归筛选影响因素。()A.错B.对9【判断题】(1分为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,针对上述问题,可采用Logistic回归筛选影响因素。()A.错B.对10【单选题】(1分)Logistic回归中,若因变量交换赋值,则关于两个Logistic回归方程的下列解释中错误的是()A.参数估计符号相同B.优势比互为倒数C.模型拟合检验与回归系数的假设检验结果相同D.参数估计绝对值相等第十四章单元测试1【单选题】(1分)某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()A.关联规则发现B.自然语言处理C.分类D.聚类2.【多选题】(1分)正确答案:ABCDWeb内容挖掘实现技术()A.文本分类B.文本总结C.文本聚类D.关联规则3【单选题】(1分)以下哪些算法是分类算法()A.EMB.C4.5C.DBSCAND.K-Mean4【单选题】(1分)以下哪些算法是基于规则的分类器()A.NaiveBayesB.C4.5C.ANND.KNN5【判断题】(1分对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。()A.错B.对6【判断题】(1分分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法。()A.对B.错7【单选题】(1分)以下说法正确的是:()A.如果增加模型复杂度,那么模型的测试错误率总是会降低B.我们不可以使用聚类“类别id”作为一个新的特征项,然后再用监督学习分别进行学习C.一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的D.如果增加模型复杂度,那么模型的训练错误率总是会降低8【单选题】(1分)对于神经网络的说法,下面正确的是:()A.增加神经网络层数,总是能减小训练数据集的分类错误率B.减少神经网络层数,总是能减小测试数据集的分类错误率C.都不对D.增加神经网络层数,可能会增加测试数据集的分类错误率9【单选题】(1分)对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,二是都设成0,下面哪个叙述是正确的?()A.其他选项都不对B.神经网络可以训练,但是所有的神经元最后都会变成识别同样的东西C.神经网络不会开始训练,因为没有梯度改变D.没啥问题,神经网络会正常开始训练10【单选题】(1分

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论