R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学_第1页
R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学_第2页
R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学_第3页
R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学_第4页
R语言数据分析与挖掘知到章节答案智慧树2023年中央财经大学_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

R语言数据分析与挖掘知到章节测试答案智慧树2023年最新中央财经大学第一章测试下面哪些是R可以存储的数据对象?()。

参考答案:

其余选项都是关于

attach()函数说法正确的是?()。

参考答案:

其余选项均正确下面哪些方式可以查看到帮助文档?()。

参考答案:

?mean和help(mean)都正确假设

y___.()。

参考答案:

执行该语句不会改变y的长度下面关于修改向量

x___.()。

参考答案:

执行语句

x第二章测试若从正态分布总体中抽样得到一组样本,样本的值为1,-1,2,3,4,5,1,2,4,3,那么样本的中位数为?()。

参考答案:

2.5若从正态分布总体中抽样得到一组样本,样本的值为7,7,5,2,5,4,7,9,4,8,那么样本的众数为?()。

参考答案:

7最大值与最小值之间的差值称为?()。

参考答案:

极差关于变异系数的说法正确的是?()。

参考答案:

其余选项都正确若从正态分布总体中抽样得到一组样本,样本的值为1,-1,2,3,4,5,1,2,4,3,4,4,那么下面哪些说法是正确的?.()。

参考答案:

该样本只有一个众数;若要计算该样本的中位数,需要先对其进行排序;该样本的极差为6第三章测试分类变量用下面哪些图形来描述较为合适?()。

参考答案:

饼图;条形图分类变量用哪些统计量来描述较为合适?()。

参考答案:

比率;比例;频数下面哪些图形用来描述数值变量的分布情况更为恰当?()。

参考答案:

直方图;概率密度曲线;箱线图下面哪些说法是正确的?()。

参考答案:

在对数值变量离散化处理的情况下,可以使用条形图展示数值变量的分布形状;可以用点图展示数值变量的分布形状下面关于table()函数说法正确的是?()。

参考答案:

table()函数本质是实现分类变量的频数统计;table()函数能够用来制作一维列联表;table()函数可以用来制作交叉表下面哪些图形用来描述分类变量的分布情况更为恰当?()。

参考答案:

柱状图;扇形图;饼图下面哪些图形用来描述分类变量与分类变量的关系更为恰当?()。

参考答案:

并排柱状图下面哪些图形用来描述分类变量与数值变量的关系更为恰当?()。

参考答案:

并排柱状图下面哪些图形用来描述数值变量与数值变量的关系更为恰当?()。

参考答案:

散点图下面哪些图形用来描述三个数值变量之间的关系更为恰当?()。

参考答案:

气泡图第四章测试合并连接是把两个表格组合在一起的数据操作方式.()。

参考答案:

对主键是数据表中观测样本的唯一标识.()。

参考答案:

对外键是另外一个数据表中观测样本的唯一标识.()。

参考答案:

对内连接是一种最简单的连接,内连接匹配两个数据表中键值相等的观测样本.()。

参考答案:

对外连接包括:内连接、左连接、右连接、全连接.()。

参考答案:

错第五章测试当两事件A和B互斥时,P(A∪B)有可能大于P(A)+P(B).()。

参考答案:

错设某地有甲乙两种报纸,该地成年人中有30%读甲报纸,15%读乙报纸,10%两种报纸都读,则成年人中有5%至少读一种报纸.()。

参考答案:

错设有1000件产品,其中850件是正品,150件是次品,从中依次抽取2件,2件都是次品的概率是0.025.()。

参考答案:

错随机变量可分为连续型随机变量和离散型随机变量.()。

参考答案:

对设X~N(0,1),则P(X<1.5)<0.9.()。

参考答案:

错第六章测试设从一个均值μ=10、标准差σ=0.6的总体中随机选取容量为n=36的样本。假定总体不是很偏,则样本均值在总体均值附近0.1范围内的近似概率大于0.7.()。

参考答案:

错设XN(16,4),则10XN(160,40).()。

参考答案:

错假定某统计人员在其填写的报表中有2%至少会有一处错误,如果我们检查一个由600份报表组成的随机样本,其中至少有一处错误的报表所占的比例在0.025~0.070之间的概率大于20%.()。

参考答案:

错卡方分布和t分布都是由正态分布导出的.()。

参考答案:

对某汽车电瓶商声称其生产的电瓶具有均值为60个月,标准差为6个月的寿命分布。现假设质检部门决定检验该厂的说法是否准确,为此随机抽取了50个该厂生产的电瓶进行寿命实验。假设厂商声称是正确的,则50个电瓶的平均寿命的抽样分布为N(60,6).()。

参考答案:

错第七章测试关于置信区间的构造,正确的是.()。

参考答案:

置信区间的宽度会受到总体方差或样本方差的影响关于两个正态总体方差之比的置信区间,正确的是.()。

参考答案:

置信区间不可能包含0在构造总体均值的置信区间的过程中,首先需要确定分位数,关于分位数确定正确的是.()。

参考答案:

分位数同时由样本量和总体方差是否已知决定关于两个总体均值之差的置信区间的形式说法正确的是.()。

参考答案:

两个总体均值之差的点估计±分位数×标准误关于配对的两个总体均值之差的置信区间的说法正确的是.()。

参考答案:

要先对配对样本做差值,得到差值序列矩估计和似然估计都可用来估计总体的未知参数.()。

参考答案:

对无论样本量大小,样本比例的区间估计都是相同的.()。

参考答案:

错假设X是来自正态总体的一个样本,在已知和未知的情况下,的置信区间估计的结果都是相同的.()。

参考答案:

错假设X和Y是分别来自正态总体的两个样本,总体均值都已知且相等,那么构成总体方差之比的置信区间的F分位数的第一自由度和第二自由度总是相等的.()。

参考答案:

错标准误就是样本的标准差.()。

参考答案:

错第八章测试下面关于假设检验两类错误正确的是.()。

参考答案:

第一类错误是为假,接受下面关于假设检验两类错误正确的是.()。

参考答案:

降低第一类错误的概率,会增加犯第二类错误的概率对于一个总体均值的假设检验,应该选用哪个统计量来检验(已知样本量大于50).()。

参考答案:

Z统计量假设X是来自正态总体N(μ,100)的一个样本,样本均值为4,样本量为25,对于假设检验:μ=5的检验统计量的值为?()。

参考答案:

-0.5假设X是来自正态总体N(μ,100)的一个样本,样本均值为4,样本量为25,对于置信水平为0.05的假设检验:μ=5说法正确的是?已知(24)=-1.71。()。

参考答案:

接受原假设假设X是来自正态总体N(μ,)的一个样本,样本均值为16,样本量为1000,对于置信水平为0.05的假设检验:μ=16说法正确的是?()。

参考答案:

该检验应该构造t统计量来检验假设X是来自正态总体N(μ,)的一个样本,样本方差为1,样本量为1000,对于置信水平为0.05的假设检验:1说法正确的是?()。

参考答案:

该检验应该构造统计量来检验假设X和Y是分别来自正态总体和的样本,样本量分别为1000和800,假设总体方差相等,对于置信水平为0.05的假设检验:说法正确的是?()。

参考答案:

该检验应该构造Z统计量来检验假设X和Y是分别来自正态总体和的样本,样本量分别为25和30,对于置信水平为0.05的假设检验:说法正确的是?()。

参考答案:

检验前,要先检验方差是否相等假设X和Y是分别来自正态总体和的样本,样本量分别为和,和未知,对于置信水平为0.05的假设检验:说法正确的是?()。

参考答案:

用F统计量检验,自由度分别为和第九章测试拟合优度检验用来判断各类别的观察频数与某一期望频数或理论频数是否一致.()。

参考答案:

对在应用独立性检验时,要求样本量应足够大,特别是每个单元格的期望频数不能太小,否则会得出错误的结论.()。

参考答案:

对拟合优度检验可以检验分类变量是否服从某种分布律分布.()。

参考答案:

对拟合优度检验又称为___.()。

参考答案:

一致性检验独立性检验(testofindependence)可以用来检验___.()。

参考答案:

两个类别变量是否独立第十章测试方差分析对数据分布的假设前提___.()。

参考答案:

总体服从正态分布方差分析对各水平方差的假设条件应满足___.()。

参考答案:

方差相等设因素有k个水平,若每个水平的均值用表示,那么方差分析的原假设是___.()。

参考答案:

H0:各水平的均值相等和H0:自变量与因变量无关都可以检验因素各水平是否服从正态分布的方法有__.()。

参考答案:

都可以单因素方差分析的效应量反应___.()。

参考答案:

处理效应平方和SSA与总平方和SST的比例无论总体是否服从正态分布,都可以使用非参数方差分析方法来实现方差分析.()。

参考答案:

对判断总体是否服从正态分布的方法除了图形法外,还可以使用检验的方法.()。

参考答案:

对在方差分析中,效应量是指随机误差与总体误差之比.其值越大,拟合效果越差.()。

参考答案:

错对于方差分析而言,要比较任意两个水平的均值是否相等,可以使用LSD多重比较或t检验.()。

参考答案:

对方差分析是分析数值变量与分类变量之间关系的统计方法,可以在一个模型中包括任意多的分类变量.()。

参考答案:

错第十一章测试将因变量的值扩大10,将自变量的值同时扩大100,则___.()。

参考答案:

回归的不变估计量具有抽样分布的原因是___.()。

参考答案:

在给定X的情况下,误差项的不同实现会导致Y的取值有所不同在其他因素相同的条件下,如果___,斜率估计量标准差较小.()。

参考答案:

解释变量X有更多变差误差项的异方差会影响OLS估计量的___.()。

参考答案:

最优性如果一个假设在5%的显著水平下不能被拒绝,则它___.()。

参考答案:

在1%的显著水平下一定不会被拒绝一元线性回归的基本假设有___.()。

参考答案:

随机变量X与Y之间存在线性关系;任意两个样本的随机误差相互独立;随机误差的方差相等;随机误差的期望为0若是一元线性回归方程的回归系数的最小二乘估计,那么下面说法正确的是___.()。

参考答案:

它的估计值为:关于一元线性回归模型的残差项,说法正确的是___.()。

参考答案:

;,即任意两个残差之间的协方差为0,注意;;若,是一元线性回归方程的回归系数的最小二乘估计,那么下面说法正确的是___.()。

参考答案:

是截距项,它表示Y的平均水平;表示,X每变动一个单位,Y变动个单位若,是一元线性回归方程的回归系数的最小二乘估计,若X标准化和Y标准化后的向量为和,且一元线性回归方程为,那么下面说法正确的是___.()。

参考答案:

回归方程穿过原点(0,0);;回归分析前,要先通过相关系数或散点图观察变量之间是否存在线性关系.()。

参考答案:

对散点图也可以用来观察样本中是否存在离群点.()。

参考答案:

对判别一元线性回归是否显著不仅可以使用t检验,也可以使用F检验.()。

参考答案:

对在一元线性回归中,如果因变量与自变量存在明显的正相关关系,那么其回归系数将显著大于0()。

参考答案:

对用于建立回归模型的样本是否独立不会影响OLS对回归系数的估计结果()。

参考答案:

错第十二章测试虚拟变量陷阱(dummyvariabletrap)是以下哪个情形?()。

参考答案:

完全多重共线性关于不完全共线性,如下哪个说法是正确的?()。

参考答案:

两个或者多个自变量是高度相关的如果回归模型中遗漏了能够影响因变量的变量,会产生的后果是___.()。

参考答案:

如果遗漏的变量和现存的变量相关,会使得当前的最小二乘估计量有偏如果模型有遗漏变量偏差,会使得哪一个最小二乘的假设条件不满足?.()。

参考答案:

****考虑有两个自变量X1和X2的回归模型,这两个自变量都是Y的影响因素。如果先使用X1对Y做回归,估计得到的回归系数很小,但是同时使用X1,X2做回归,发现X1前面的回归系数变大了很多。这意味的前面的一元线性回归存在___.()。

参考答案:

遗漏变量偏差下述模型使用个人的收入和教育水平来解释个人的储蓄:.其中变量Edu是一个二元变量,如果是受过高等教育的个体,Edu=1,否则Edu=0。请问该研究中,基准组是___.()。

参考答案:

未受过高等教育的群体下述模型使用个人的收入和教育水平来解释个人的储蓄:.其中变量Edu是一个二元变量,如果是受过高等教育的个体,Edu=1,否则Edu=0。如果,我们把该系数解释为___.()。

参考答案:

给定收入水平,受过高等教育的群体的平均储蓄比没受过高等教育的群体高个单位多重共线性会导致回归系数不显著、回归系数正负号颠倒等与常识违背的现象。()。

参考答案:

对在多元回归分析中,回归系数可以直接用来评价自变量的重要性。()。

参考答案:

错如果根据来选择变量并建立多元线性回归模型,那么我们可能会得到一个复杂的模型。()。

参考答案:

对第十三章测试Logistic回归与多重线性回归比较()

参考答案:

Logistic回归的因变量为二分类变量Logistic回归适用于因变量为()

参考答案:

二分类变量;多分类有序变量;多分类无序变量Logistic回归可用于()

参考答案:

均可Logistic回归模型的参数估计为加权最小二乘估计。()

参考答案:

错当因变量的取值在[0,1]变化,而自变量的取值范围超出了[0,1],甚至在整个实数轴上取值时,可以采用Logistic回归模型解决这个问题。()

参考答案:

错筛选危险因素常用的方法有()

参考答案:

都可Logistic回归中自变量若为多分类变量,宜将其按哑变量处理,与其他变量进行变量筛选时可用()

参考答案:

应将几个哑变量作为一个因素,整体进入回归方程为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,针对上述问题,可采用Logistic回归筛选影响因素。()

参考答案:

错为研究低龄青少年吸烟的外在因素,研究者采用整群抽样,在某中心城区和远城区的初中学校,各选择初一年级一个班的全部学生进行调查,针对上述问题,可采用Logistic回归筛选影响因素。()

参考答案:

错Logistic回归中,若因变量交换赋值,则关于两个Logistic回归方程的下列解释中错误的是()

参考答案:

参数估计符号相同第十四章测试某超市研究销售纪录数据后发现,买啤酒的人很大概率也会购买尿布,这种属于数据挖掘的哪类问题?()

参考答案:

关联规则发现Web内容挖掘实现技术()

参考答案:

文本总结;关联规则;文本聚类;文本分类以下哪些算法是分类算法()

参考答案:

C4.5以下哪些算法是基于规则的分类器()

参考答案:

C4.5对于SVM分类算法,待分样本集中的大部分样本不是支持向量,移去或者减少这些样本对分类结果没有影响。()

参考答案:

对分类规则的挖掘方法通常有:决策树法、贝叶斯法、人工神经网络法。()

参考答案:

对以下说法正确的是:()

参考答案:

一个机器学习模型,如果有较高准确率,总是说明这个分类器是好的对于神经网络的说法,下面正确的是:()

参考答案:

增加神经网络层数,可能会增加测试数据集的分类错误率对于一个分类任务,如果开始时神经网络的权重不是随机赋值的,二是都设成0,下面哪个叙述是正确的?()

参考答案:

神经网

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论