2023年研究生类应用统计硕士(MAS)历年高频考题带答案难题附详解_第1页
2023年研究生类应用统计硕士(MAS)历年高频考题带答案难题附详解_第2页
2023年研究生类应用统计硕士(MAS)历年高频考题带答案难题附详解_第3页
2023年研究生类应用统计硕士(MAS)历年高频考题带答案难题附详解_第4页
2023年研究生类应用统计硕士(MAS)历年高频考题带答案难题附详解_第5页
已阅读5页,还剩15页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2023年研究生类应用统计硕士(MAS)历年高频考题带答案难题附详解(图片大小可自由调整)第1卷一.历年考点试题黑钻版(共50题)1.在多元回归模型中,置信度越高,在其他情况不变时,临界值tα/2(n-k-1)越大,回归系数的置信区间______。A.越大B.越小C.不变D.根据具体情况而定2.编制数量指标综合指数所采用的同度量因素是______。A.质量指标B.数量指标C.综合指标D.相对指标3.设随机变量X与Y独立同服从参数为λ的指数分布Exp(λ),令求E(Z)。4.如果某月份的商品销售额为120万元,该月的季节指数等于1.5,则消除季节因素后该月的销售额为______万元。A.60B.70C.80D.1005.设X1,X2,…,X9是来自标准正态总体X的简单随机样本,而

证明统计量Z服从自由度为2的t分布。6.设随机变量X服从参数为λ的指数分布,求Y=min{X,2}的分布函数。7.当σ未知时,正态总体均值μ的置信度为1-α的置信区间的长度为______。

A.

B.

C.

D.2tα(n-1)8.在单样本t检验中,备择假设是总体均值>1000,则这属于______。A.左侧检验B.右侧检验C.双侧检验D.双尾检验9.如果y关于x的回归方程,而且这个回归方程的R2=0.81,则x与y之间的相关系数______。A.r=1B.r=-1C.r=0.9D.r=-0.910.2000年的一项调查发现,新购买小汽车的人中有40%是女性,在今年将再做一项调查旨在检验新车主中女性的比例是否有显著增加,建立的原假设和备择假设为______。A.H0:π=40%,H1:π≠40%B.H0:π≥40%,H1:π<40%C.H0:π≤40%,H1:π>40%D.H0:π<40%,H1:π≥40%11.下面不属于描述统计问题的是______。A.根据样本信息对总体进行的判断B.了解数据分布的特征顺序数据C.分析感兴趣的总体特征D.利用图、表或其他数据汇总工具分析数据12.给出在一元线性回归中:

(1)相关系数的定义和直观意义;

(2)判定系数的定义和直观意义;

(3)相关系数和判定系数的关系。13.95%的置信水平是指______。A.总体参数落在一个特定的样本所构造的区间内的概率为95%B.总体参数落在一个特定的样本所构造的区间内的概率为5%C.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为95%D.在用同样方法构造的总体参数的多个区间中,包含总体参数的区间比例为5%14.某商店销售量增长10%,商品零售价格也增长10%,则商品销售额增长______。A.25%B.15%C.20%D.21%15.当相关系数r=0时,表明______。A.现象之间完全无关B.相关程度较小C.现象之间完全相关D.无线性相关关系16.一个12/袋中有5个黑白2种颜色的球,每一个球是黑还是白机会均等。从中有放回地任取4次,每次取1个。已知有1次取到白球,3次取到黑球,求口袋中白球可能个数的17.抽样推断的精确度和抽样误差的关系是______。A.前者高说明后者小B.前者高说明后者大C.前者变化而后者不变D.两者没有关系18.设X为一随机变量,其期望为EX,C为任意常数,则______A.B.C.D.19.回归分析的估计标准误差______。A.可以是负值B.等于因变量的平方根C.是根据残差平方和计算的D.等于自变量的平方根20.假设其他条件不变,把α从5%降低到2.5%则总体均值μ的置信程度1-α的置信区间的宽度将______A.增加B.不变C.降低D.可能增加,也可能降低21.根据可决系数与F统计量的关系可知,当r2=1时,有______。A.F=1B.F=-1C.F=0D.F=∞22.考虑总体均值的95.44%置信区间,已知总体服从正态分布且标准差为10,要使得到的置信区间的半径不超过1,需要的最小样本容量为______。A.100B.400C.900D.160023.简述相关系数和函数关系的差别。24.加权平均数的大小取决于______。A.频数绝对量的大小和变量值的大小B.频数之间的比率C.频数绝对量的大小和频数之间的比率D.频数之间的比率和变量值的大小25.先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。这种抽样方式称为______。A.分类抽样B.配额抽样C.系统抽样D.整群抽样26.在样本量一定,进行区间估计时______。A.置信概率越小,相应的置信区间也越小B.置信概率越小,相应的置信区间越大C.置信概率越大,相应的置信区间越小D.置信概率的大小不影响置信区间的大小27.设Xij是在Ai水平上,第j个样本单位的数据,则下列等式中不正确的是______。

A.

B.

C.

D.SST=SSE+SSA28.某地区为了了解小学生发育状况,把全地区各小学按地区排队编号,然后根据排队编号顺序每隔20个学校抽取一个学校,对抽中学校所有学生都进行调查,这种调查方式是______。A.简单随机抽样B.等距抽样C.类型抽样D.整群抽样29.假设检验的基本思想可以用______来解释。A.中心极限定理B.置信区间C.小概率事件D.正态分布的性质30.若一个参数的估计量值为2.4,该估计量的标准差值为0.2,则该参数的一个约95%置信区间为______。A.[2.008,2.792]B.[2.0,2.8]C.[2.2,2.6]D.[2.071,2.729]31.如果要对稀少群体进行调查,适宜采用的调查方式是______。A.滚雪球抽样B.判断抽样C.系统抽样D.整群抽样32.如果一组数值中有一项为0,则不能计算______。A.算术平均数和调和平均数B.调和平均数和几何平均数C.算术平均数和几何平均数D.无法确定33.设X1,X2,X3,X4是来自总体X的样本,EX=μ,则______是μ的最有效估计。

A.

B.

C.

D.34.已知前两年的平均增长速度9%,后三年的平均增长速度为10%,这5年的平均增长速度为______。

A.

B.

C.

D.35.抽样误差的大小______。A.既可以避免,也可以控制B.无法避免,但可以控制C.无法避免,也无法控制D.可以避免,但无法控制36.将一枚硬币独立地掷两次,引进事件:A1={掷第一次出现正面},A2={掷第二次出现正面},A3={正、反面各出现一次},A4={正面出现两次},则______A.A1,A2,A3两两独立B.A1,A2,A3相互独立C.A2,A3,A4两两独立D.A2,A3,A4相互独立37.当出现特大值或特小值时,应设置______。A.闭口组B.开口组C.单项数列D.组距数列38.在多元线性回归关系中,如果F检验表明线性关系显著,则意味着______。A.在多个自变量中至少有一个自变量与因变量之间的线性关系显著B.所有的自变量与因变量之间的线性关系都显著C.在多个自变量中至少有一个自变量与因变量之间的线性关系不显著D.所有的自变量与因变量之间的线性关系都不显著39.若随机变量X1,X2,X3,X4相互独立,且X1服从正态分布N(0,1),令T=a(X1+2X2)2+b(3X3-4X4)2,则(a,b)-______时,统计量T服从卡方分布χ2。A.(0.2,0.4)B.(0.02,0.4)C.(0.02,0.04)D.(0,0.04)40.从装有红、白、黑球各一个的口袋中任意取球(取后放回),直到各种颜色的球至少取得一次为止。求:(1)摸球次数恰好为6次的概率。(2)摸球次数不少于6次的概率。41.两变量的线性相关系数为r,对二者建立一元回归模型y=β0+β1x+ε,其中的系数均采用最小二乘估计,则根据以下关系式不成立的是______。

A.

B.

C.

D.42.来自总体甲的一个容量为16的样本的方差,来自总体乙的一个容量为20的样本的方差。在α=0.05的显著性水平下,检验假设,得到的结论是______。A.拒绝H0B.不拒绝H0C.可以拒绝也可以不拒绝H0D.可能拒绝也可能不拒绝H043.以下计算组中值的方法错误的是______。A.(上限+下限)/2B.上限+下限/2C.上限-邻组组距/2D.下限+邻组组距/244.设X和Y是相互独立同分布的随机变量,且已知P(X=1)=p,P(X=0)=1-p,0<p<1。又设问p为何值时,才能使X和Z相互独立?45.某种配偶的后代按体格的属性分三类,各类的数目是:10,53,46。按照某种遗传模型其频率之比应为p2:2p(1-p):(1-p)2,问数据与模型是否相等?(α=0.05)46.用A,B,C三类不同元件连接成两个系统N1和N2。当元件A,B,C都正常工作时,系统N1正常工作;当元件A正常工作且元件B,C中至少有一个正常工作时,系统N2正常工作。已知元件A,B,C正常工作的概率依次为0.80,0.90,0.90,且某个元件是否正常工作与其他元件无关。分别求系统N1和N2正常工作的概率P1和P2。47.在假设检验中,如果所计算出的p值越小,说明检验的结果______。A.越显著B.越不显著C.越真实D.越不真实48.对于一元线性回归模型,,i=1,2,…,n,其中,e1,…,en独立同分布,e1期望为0,方差有界,那么a的最小二乘估计和b的最小二乘估计______。A.独立B.不独立C.关系不确定49.甲乙两人将进行一局象棋比赛,考虑事件A={甲胜乙负},则A为______。A.甲负乙胜B.甲乙平局C.甲负D.甲负或平局50.设X1,X2,…,Xn,n>1是来自总体期望为μ,总体方差为σ2的样本,X样本均值,则______。

A.

B.

C.

D.第1卷参考答案一.历年考点试题黑钻版1.参考答案:A2.参考答案:A3.参考答案:解:方法一:易见X和Y的联合密度为f(x,y)=λ2e-λxe-λy,x>0,y>0,将Z看作X,Y的函数,令

方法二:先求fZ(z),再求。

(1)当z>0时,

当0<z<1时,

当z≥1时,

(2)

方法三:对于x≥0,当X=x时,Z仅是Y的函数,故

于是由全期望公式得

从上述解题过程可以看出,条件“X与Y独立”实际上是多余的。

方法四:将全期望公式拓展如下:

则E(Z)=E[E(Z|X,Y)]=E(3X+1|X≥Y)P(X≥Y)+E(6Y|X<Y)P(X<Y)

又E(3X+1|X≥Y)=3E(X|X≥Y)+1,E(6Y|X<Y)=6E(Y|X<Y)

故只需计算E(X|X≥Y),E(Y|X<Y)

为此,先计算X≥Y条件下X的条件分布函数F1(x|X≥Y)和条件密度函数f1(x|X≥Y)。

由于X与Y独立,则(X,Y)的联合密度函数为f(x,y)=λ2e-λ(x+y),x≥0,y≥0。

当x≥0时,有

进而

从而

其次,计算X<Y条件下Y的条件分布函数F2(y|X<Y)和条件密度函数f2(y|X<Y)。

当y≥0时,有

进而

从而

故4.参考答案:C5.参考答案:证明:由X1,X2,…,X9是来自标准正态总体X的简单随机样本可得,X1,X2,…,X9是相互独立的,并且都服从标准正态分布,Y1,Y2也是相互独立的。而

对任给的-∞<a,B<+∞,c>0,

P(Y1≤a,Y2≤b,S2≤c)=P((Y1≤a)∩(Y2≤b,S2≤c))

=P(Y1≤a)P(Y2≤b,S2≤c)=P(Y1≤a)P(Y2≤b)P(S2≤c)

则Y1,Y2,S2相互独立,进而Y1-Y2与S2独立,则,即。6.参考答案:解:易知X的分布函数为FX(x)=1-e-λx,x>0,Y的分布函数为

FY(y)=P(Y≤y)=P(min(X,2)≤y)=1-P(min(X,2)>y)

=1-P(X>y,2>y)

当0<y<2,FY(y)=1-P(X>y)=P(X≤y)=FX(y)=1-e-λy;当y≥2,FY(y)=1。7.参考答案:B8.参考答案:B[解析]A项,若假设检验的拒绝区域在样本统计量分布的左端,则称这种单侧检验为左侧检验,它适用于担心样本统计量会显著低于假设的总体参数的情况,其原假设和备择假设为

B项,右侧检验的拒绝区域在样本统计量分布的右端,其原假设为

备择假设为

CD两项,双侧检验或双尾检验的原假设和备择假设为

其目的是观察在规定的显著水平下所抽取的样本统计量是否显著地高于或低于假设的总体参数。9.参考答案:D10.参考答案:C[解析]通常将研究者要证明的结论作为备择假设。原假设与备择假设互斥,肯定原假设,意味着放弃备择假设;否定原假设,意味着接受备择假设。由题意可知原假设H0为π≤40%,备择假设H1为π>40%。11.参考答案:A12.参考答案:(1)相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量。若相关系数是根据总体全部数据计算的,称为总体相关系数,记为ρ;若是根据样本数据计算的,则称为样本相关系数,记为r。样本相关系数的计算公式为:

按上述计算公式计算的相关系数也称为线性相关系数,或称为Pearson相关系数。r仅仅是x与y之间线性关系的一个度量,它不能用于描述非线性关系。当r的绝对值越接近于1时,两个变量之间的线性相关关系越强;而当r=0时,只表示两个变量之间不存在线性相关关系,并不说明变量之间没有任何关系,它们之间可能存在非线性相关关系。因此,当r=0或很小时,不能轻易得出两个变量之间不存在相关关系的结论,而应结合散点图做出合理的解释。

(2)回归平方和占总离差平方和的比例称为判定系数,记为R2,其计算公式为:

判定系数测度了回归直线对观测数据的拟合程度。的取值范围是[0,1],越接近于1,表明回归平方和占总平方和的比例越大,回归直线与各观测点越接近,能用x的变化来解释的y值变差的部分就越多,回归直线的拟合程度就越好;反之,越接近于0,回归直线的拟合程度就越差。

(3)在一元线性回归中,相关系数实际上等于判定系数的平方根,并且其正负符号和回归方程中回归系数的正负符号相同。13.参考答案:C14.参考答案:D[解析]销售额=销售量销售价格,销售量增长10%,商品零售价格也增长10%,则商品销售额增长为:

15.参考答案:D16.参考答案:解:设Ak,k=0,1,…,5为口袋中有k个白球

设B为有放回抽取4次,有1次取到白球,3次取到黑球。在Ak发生的条件下,从口袋中每次取到白球的概率为,于是,k=0,1,…,5

则17.参考答案:A[解析]估计误差越小,估计的精度就越好;估计误差越大,估计的精度就越差。18.参考答案:B[解析]E(X-C)2=E(X-EX+EX-C)2=E(X-EX)2+2(EX-C)·E(X-EX)+(EX-C)2=E(X-EX)2+0+(EX-C)2≥E(X-EX)219.参考答案:C20.参考答案:A[解析]总体均值μ的置信程度1-α的置信区间为

当其他条件不变,α降低时,或增加,因而置信区间的宽度将增加。21.参考答案:D[解析]可决系数(判定系数),F统计量的计算公式为,比较两个公式可知,当r2=1时,即有SSR=SST,残差平方和SSE=0,F=∞。22.参考答案:B23.参考答案:变量之间的关系可分为两种类型:函数关系和相关关系。

(1)函数关系

设有两个变量和,变量随变量一起变化,并完全依赖于,当变量取某个数值时,依确定的关系取相应的值,则称是的函数。由此可见函数关系是一种自变量与因变量间映射的确定性关系。

(2)相关关系

相关关系是指变量之间确实存在的但关系值不固定的相互依存关系。在这种关系中,当一个(或几个)变量的值确定以后,另一个变量的值与之相对应按某种规律在一定范围内波动。这是一种非确定的关系。24.参考答案:D25.参考答案:B26.参考答案:A27.参考答案:A28.参考答案:D29.参考答案:C30.参考答案:B[解析]根据3σ原则,约有68%的数据在平均数±1个标准差的范围之内;约有95%的数据在平均数±2个标准差的范围之内;约有99%的数据在平均数±3个标准差的范围之内。则该参数的一个约95%置信区间为:[2.4±2σ]=[2.0,2.8]。31.参考答案:A32.参考答案:B33.参考答案:A34.参考答案:D35.参考答案:B36.参考答案:A[解析]由题意,,,,所以,

所以,A1,A2,A3两两独立。而

都不满足事件相互独立的条件,故选择A项。37.参考答案:B38.参考答案:A39.参考答案:[解析]由于随机变量,,,相互独立,可得:

40.参考答案:解:设Ak为“直到各种颜色的球至少取得一次为止所需摸球次数为k次”,k=3,4,…则事件Ak发生必为第k次首次摸到红球或白球或黑球,其概率为;剩下(k-1)次摸到的必是其余2种颜色的球,且每种颜色至少出现一次,最多重复(k-2)次,每次出现的概率都是。因此

(1)摸球次数恰好为6次的概率:。

(2)摸球次数不少于6次的概率:。41.参考答案:D[解析]此题要加“H0:β1=0”。由

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论