2021统计学考研应用统计硕士专硕考研真题库_第1页
2021统计学考研应用统计硕士专硕考研真题库_第2页
2021统计学考研应用统计硕士专硕考研真题库_第3页
2021统计学考研应用统计硕士专硕考研真题库_第4页
2021统计学考研应用统计硕士专硕考研真题库_第5页
已阅读5页,还剩13页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2021统计学考研应用统计硕士专硕考研真题库一、选择题部分某政府机构想尽快了解社会公众对其出台的一项政策的态度,最恰当的数据搜集 方式是()。A 面访B深度访谈C计算机辅助电话调查D邮寄调查【答案】C 【解析】C项,计算机辅助电话调查是利用现代化电脑程控通讯设备进 行的随机电话访问方式,采用这种访问调查方式,具有调查内容客观真实、保密 性强、访问效率高等特点。A项,面访即调查者直接走访被调查者,当面听取被 调查者的意见,可以比较全面、深入,能获得大量真实的研究资料,但这种方法 容易使研究结论带有主观成分;B项,深度访谈是一种无结构的、直接的、一对 的访问形式。最常应用于探测性调查,但是这种访谈

2、方法所得的资料难以进行 统计处理和定量分析,而且特别耗费时间,使得访谈的规模受到较大的限制;D 项,邮寄调查法,是指将事先设计好的调查问卷,通过邮政系统寄给被调查者, 由被调查者根据要求填写后再寄回,是市场调查中一种比较特殊的调查方法。这 种调查方法的调查周期通常比较长,时效性差。将一颗质地均匀的硬币先后抛掷3次,至少出现2次正面的概率是()。A 1/43/8D.5/8【答案】C 【解析】记。为抛掷3次硬币出现正面的次数,根据古典概率计算公式可知:设函数“ x )在区间(a,b)上等于0.4,在此区间之外等于0,如果f(x) 可以作为某连续型随机变量的密度函数,则区间(a,b )可以是()。(

3、0,0.5)(0.5, 2.5 )(1.5, 2.5 )(0,2.5)【答案】D 【解析】根据概率密度函数的性质可知:0.4dx - 0.4(方一 or) = 1解得:、-: = ,只有D项满足条件。. 2000年的一项调查发现,新购买小汽车的人中有40%是女性,在今年将再 做一项调查旨在检验新车主中女性的比例是否有显著增加,建立的原假设和备择 假设为()。A . H0 :n = 40% , H1 : n/40%H0:n40% , H1 : n40%H0:n40%H:nv40% , H1 : n40%【答案】C 【解析】通常将研究者要证明的结论作为备择假设。原假设与备择假设 互斥,肯定原假设,

4、意味着放弃备择假设;否定原假设,意味着接受备择假设。 由题意可知原假设H。为n40%。已知数列1,3,3,5,5,7,7,9, 122,下面说法错误是()。A 算数平均数是18B中位数是5众数是5D 极差是121【答案】C 【解析】众数是一组数据中出现次数最多的数值,由题干可知,众数分 别是3,5,7。在多元线性回归分析中,t检验是用来检验()。A总体线性关系的显著性B各回归系数的显著性C样本线性关系的显著性。匕:附邙2二邙广0【答案】B 【解析】在多元线性回归分析中,F检验用来检验回归方程整体线性关 系的显著性;t检验用来检验各回归系数的显著性;X址 疔二 是进 行回归方程整体线性关系显著性

5、检验时的原假设。以下关于“非抽样误差”说法正确的是()。A只有非全面调查中才有B只有全面调查中才有C全面调查和非全面调查中都有D全面调查和非全面调查都没有【答案】C 【解析】抽样误差是由于抽样的随机性引起的样本结果与总体真值之间 的误差;非抽样误差是相对抽样误差而言的,是指除抽样误差之外的,由于其他 原因引起的样本观察结果与总体真值之间的差异。抽样误差是一种随机性误差, 只存在于概率抽样中;非抽样误差则不同,无论是概率抽样、非概率抽样,或是 在全面性调查中,都有可能产生非抽样误差。把数据中的每个数值减去最小值然后除以极差是一种常用的数据预处理方法。对于经过这一变换之后的数据,以下说法不正确的是

6、()。A服从正态分布B没有计量单位C.取值在0和1之间D是相对数【答案】A 【解析】极差等于一组数据中的最大值减去最小值,将数据中的每个数 值减去最小值然后除以极差得到一个相对数,其取值在0和1之间。经题干中 的方法处理后,消除了量纲,数据没有计量单位了,并且数据仍保持原分布。 11名研究人员希望通过图形来说明4月份以来北京地区二手房租金每天的 变化,如下哪个图形最合适()。直方图B 散点图C 折线图D 茎叶图【答案】C 【解析】直方图是用于展示分组数据分布的一种图形,它是用矩形的宽 度和高度(即面积)来表示频数分布的;散点图是用二维坐标展示两个变量之间 关系的一种图形;茎叶图是反映原始数据分

7、布的图形;如果数值型数据是在不同 时间上取得的,即时间序列数据,则可以绘制线图,线图主要用于反映现象随时 间变化的特征。以下关于参数和统计量的说法正确的是()。A总体参数是随机变量B样本统计量都是总体参数的无偏估计量C对一个总体参数进行估计时,统计量的表达式是惟一的D样本统计量是随机变量【答案】D 【解析】参数是用来描述总体特征的概括性数字度量,它是研究者想要 了解的总体的某种特征值,开究者所关心的参数通常有总体平均数、总体标准差、 总体比例等;由于总体数据通常是不知道的,所以参数是一个未知的常数。在对 总体参数进行估计时,可以采用最小二乘估计、极大似然估计等估计方法,不同 方法得到的估计量可

8、能不同,也不一定具有无偏性的性质。统计量是用来描述样 本特征的概括性数字度量,它是根据样本数据计算出来的一个量,是样本的函数; 由于抽样是随机的,因此统计量是随机变量。关于有常数项的一元线性回归方程,以下正确的是()。A判定系数等于自变量和因变量的相关系数B判定系数等于自变量和因变量相关系数的平方C自变量和因变量相关系数等于判定系数正的平方根 D修正的判定系数等于自变量和因变量相关系数的平方【答案】B 【解析】在一元线性回归中,自变量和因变量的相关系数实际上是判定 系数的平方根,且它与回归系数的符号一致。如果Y关于X的回归方程为7 = - - -,而且这个回归方程的皆=/ ,则x与y之间的相关

9、系数()。r二1r二-1r二 0.9r二-0.9【答案】D 【解析】在一元线性回归中,自变量和因变量的相关系数实际上是判定系数的平方根。由y二2-x知,x与y是负相关的,所以其相关系数为-0.9。)。. 95%置信水平的区间估计中95%的置信水平是指(A 总体参数落在一个特定的样本所构造的区间内的概率为95%B总体参数落在一个特定的样本所构造的区间内的概率为5%C在用不同的样本构造的总体参数的多个区间中,包含总体参数的区间比例为 95%D在用不同的样本构造的总体参数的多个区间中,包含总体参数的区间比例约 为95%【答案】C 【解析】如果用某种方法构造的所有区间中有95%的区间包含总体参数 的真

10、值,5%的区间不包含总体参数的真值,那么用该方法构造的区间称为置信 水平为95%的置信区间。关于单因素方差分析中的F检验()。A拒绝域在F分布曲线的右侧B F统计量的样本观测值可能为负值C拒绝域在F分布曲线的左侧和右侧D以上表述都不对【解析】在单因素方差分析中,若 ,则拒绝原假设H。;若,:,则不 能拒绝原假设H。在假设检验中,如果所计算出的P值越小,说明检验的结果()。A .越显著B .越不显著C.越真实D越不真实【答案】A 【解析】P值就是当原假设为真时所得到的样本观察结果或更极端结果 出现的概率。如果P值很小,说明这种情况发生的概率很小,而如果出现了, 根据小概率原理,则有理由拒绝原假设

11、;P值越小,拒绝原假设的理由就越充分。 18某商场2008年12月的商品销售额为100万元该月的季节指数等于125% (乘法模型),在消除季节因素后该月的销售额为()。A 80万元B 100万元C . 125 万元D以上都不对【答案】A 【解析】计算出季节指数后,将各实际观察值除以相应的季节指数,即可将季节性成分从时间序列中分离出去。=80 (万元)19 在一次问卷调查中要求被调查者直接填写出个人的民族、婚姻状况、居住地的邮政编码、年龄和收入。以下说法不正确的是()。A民族是定性变量B邮政编码是定量变量C年龄的计量尺度是定比尺度D收入数据是定量数据【答案】B 【解析】变量分为定性变量和定量变量

12、。定性变量是指观测的个体只能 归属于几种互不相容类别中的一种,一般是用非数字来表达其类别的变量。定量 变量是指可以用数值表示其观察结果,而且这些数值具有明确的数值含义,不仅 能分类而且能测量出来具体大小和差异的变量。定距尺度也称等距尺度或区间尺 度,是一种不仅能将变量(社会现象)区分类别和等级,而且可以确定变量之间 的数量差别和间隔距离的方法。定比尺度也称比例尺度或等比尺度,是一种除有 定距尺度的全部性质之外,还能测量不同变量(社会现象)之间的比例或比率关 系的方法;以定比尺度测量的数据具有绝对零点。由于邮政编码只是对应于行政 区域的一标签,其数值并没有实际意义,故它是定性变量。20 下列指数

13、中属于质量指数的是()。A消费者价格指数B销售量指数C GDP增长率D销售额指数【答案】A 【解析】数量指标指数是反映数量指标变动程度的相对数,如商品销售量指数、工业产品产量指数等,数量指标通常采用实物计量单位。质量指数指标 是反映品质指标变动程度的相对数,如产品价格指数、产品单位成本指数等,质 量指标通常采用货币计量单位。二简答题(本题包括15题共5个小题,每小题10分,共50分)。1简述假设检验的过程。答:假设检验的过程如下:根据所研究问题的要求提出原假设:(或称为零假设、无效假设)和备择 假设;确定显著性水平,显著性水平为作假设检验时犯第一类错误的概率。选择合适的检验方法,构造适当的检验

14、统计量,确定统计量的分布,并代 入样本数据计算在原假设成立条件下它的数值。(3 )根据计算出的检验统计量观测值,查阅统计表,确定相对应的,值;将,值 与显著性水平工比较,若-,则拒绝H0,接受H1 ;若工,则不能拒绝 %。2请给出你所知道的概率抽样的组织方式。答:概率抽样也称随机抽样,是指遵循随机原则进行的抽样,总体中每个单位都 有一定的机会被选入样本。调查的实践中经常采用的概率抽样方式有以下几种:简单随机抽样。简单随机抽样指从包括总体N个单位的抽样框中随机地、 逐个地抽取n个单位作为样本,每个单位入样的概率是相等的;分层抽样。分层抽样是指将抽样单位按某种特征或某种规则划分为不同的 层,然后从

15、不同的层中独立、随机地抽取样本,将各层的样本结合起来,对总体 的目标量进行估计;整群抽样。整群抽样是指首先将总体中若干个单位合并为组,这样的组称 为群,抽样时直接随机抽取一个群,然后对中选群中的所有单位全部实施调查;系统抽样。系统抽样是指将总体中的所有单位(抽样单位)按一定顺序排 列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规 则确定其他样本单位;多阶段抽样。采用类似整群抽样的方法,首先抽取群,但并不是调查群内 的所有单位,而是再进一步抽样,从选中的群中抽取出若干个单位进行调查;因 为取得这些接受调查的单位需要两个步骤,所以将这种抽样方式称为二阶段抽 样;这里,群是初级

16、抽样单位,第二阶段抽取的是最终抽样单位。将这种方法推 广,使抽样的段数增多,就称为多阶段抽样。3在盒子图(箱线图)的作图中,会使用哪些描述指标。答:箱线图(Boxplot)也称箱须图(Box-whisker Plot),是利用数据中的五 个统计量:最小值、第一四分位数、中位数、第三四分位数与最大值来描述数据 的一种方法,它也可以粗略地看出数据是否具有对称性,分布的分散程度等信息, 特别可以用于对几个样本的比较。故箱线图使用的描述指标有:最小值、第一四 分位数、中位数、第三四分位数与最大值。4下列调查问卷中的提问都有问题,请修改。您和您爱人是否对现有住房满意?您最近一次是几点上班的?绝大多数喝过

17、明光牛奶的人都认为它口味纯正,您认为是这样的吗? 答:(1)您对现有住房满意吗?您爱人呢?(2)您最近一次是几点离开家去上班的?您认为明光牛奶的口味纯正吗? 5如果有百分之五的人是左撇子,而小明和他弟弟都是左撇子;那么小明和他弟弟都是左撇子这个事件的概率是不是0.05x0.05二0.0025 ?为什么? 答:不是。显然,小明和他弟弟都是左撇子的事件不是独立的,所以这种计算方法错误。当两个事件相互独立时:当两个事件不相互独立时:三二一二上p三上二p三f二三 (2)记事件A为小明是左撇子,事件B为小明的弟弟是左撇子。显然小明是左撇子 和他弟弟是左撇子这两个事件不相互独立,所以选择第二个公式计算小明

18、和他弟 弟都是左撇子这个事件的概率。三.计算与分析题(本题包括13题共3个小题,第1题10分,第2、3题30分,共70分)1离散型随机变量X的概率分布率如下。X123斗P020.103a(1)确定概率分布率中a的值。(2 )试给出随机变量X的分布F(x)。(3 )计算随机变量X的均值和方差。解:(1)根据离散型随机变量的概率分布列的正则性,即二二=诃知:0.2-0.1-0.3-q= 1得:=-当时,:二-;当上时,=-;当:兰-时,f二 m -一 d二丨所以随机变量0的分布为:飞 X10_2:1 jr 2F(.x) = 0_3r 2x 30-6: 3 x 4(3)(X)=工兀凸=lx 0_2

19、一 2x 0-1 - 3x 0.3-4x 0_4 = 2.9心 g = EX-E(Xf = fi=l= (l-2.9)2x02-(2-2.9)2x0.1-(3-2.9)2x0.3-(4-2.9yx0.4= 1.292 家紧急救护中心目前每天的值班护士人数相同。表1是2010年11月1 日至2010年11月26日到紧急救护中心的病人数(紧急救护中心周六,周日 不营业),表2和表3分别是表1数据的描述统计和方差分析的结果。根据表1、表2和表3中的数据和统计分析结果,请你替这家紧急救护中心的主 任给他的上级主管部门撰写一份报告,阐明根据一周每天病人人数安排相应的值 班护士人数的理由。报告至少涵盖下面

20、两项内容:周中每天的病人人数是否存在差异?如果存在差异,哪些天似乎是最繁忙的?炭1紧急敘#叶心病人数日期j镉扎数2010 年 1U H H星期38220年丨丿j 2日星期二27202年 11 JJ 3 n星期三2K珂 10 年 11 J1 4 1 1222010 年 H JI 5 FI浪期五3520EO 年 H M 8 ri星期一3520W 年 II H 9 H星期二252010 年 1 H IO S星期H21)2010年仃月11日212010 年 11 H 12 日星期打一342010 年1 月 15 |星期-372010 年 H H 16 日星期二252010 年 11 M 17 B星期匚

21、2720iQ Il JI 18 11星期网212010 年 i 1 J 19 H星期五352010 年 H /J 22 R星期-37加10 年 11 Jj 23 0星期:262050 年 11 JJ 24 日星期匚2B20W 年 ii JJ 25 11星期艸2320W Il JJ 26 i 1星期五33农2描述统计观测数求和平均方逆星期-414736751383333星期二410325.750.916667星期41122S0.666667星期四48721,750.916667星期五413731250.916667衷汐差分林 差并源 S5MSF 卩小川朋 F丽I _组间605.24(51.315

22、1.3 6.26E-12 3.055568组内1515!总计620.219620.2答:(1)提出假设:城:/4=灼=爲=5场:74(2=希)不完全相等由表3可知,方差分析中F检验的P-value二6.26E - 12二,故拒绝原 假设,认为周一至周五每天病人的平均人数之间有显著差异。(2)由表二我们知道周一至周五每天病人的平均人数里周一和周五最多,周四 病人的平均人数最少,故可减少周四相应的值班护士人数增派安排到周一和周 五,以达到护士人员的合理安排优化配置。报告略。3某汽车租赁公司的财务主管发现有位司机报销的年度维修费用过高,你怀疑 他和汽车维修公司合伙,开出虚高的发票。这位财务主管收集了

23、 6位非常可靠的 司机的汽车年度维修费用和对应的汽车使用年限数据(见表4)。以年度维修费 用为因变量y,相应汽车的使用年限为自变量X,建立回归模型y =戊+ 0兀+ 或者耳二心+ 0匹+气(2= L 6)在EXCEL中,通过回归分析,得到表5和表6的输出结果。这位司机提交的年 度维修费用发票共8001元,他的汽车的使用年限为5年。根据表5和表6,可以计算使用年限为5年的汽车对应的年度维修费用的95%置信预测区间为4498.722,7348.021。请你为这位财务主管给他的上级主管部门撰写一个500字以内的报告,阐明调 查这位司机的理由。报告至少涵盖下面两项内容:(1)解释模型的合理性;(2 )区间预测的合理性。注:在计算预测区间时使用了下面的公式。给定汽车的使用年限xp,汽车年度维修费用的置信度为1-a的预测区间为:,其中,s是标准差的估计。表4维

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论