人大统计学考研历年真题03-09参考答案_第1页
人大统计学考研历年真题03-09参考答案_第2页
人大统计学考研历年真题03-09参考答案_第3页
人大统计学考研历年真题03-09参考答案_第4页
人大统计学考研历年真题03-09参考答案_第5页
已阅读5页,还剩24页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!1人大统计学考研历年真题参考解答精华版(03-09)2009 年人大统计学专业课初试题参考解答一、设第一、二个总体均值分别为 与 ,样本均值分别为 与 ,样本方差分别为12 1X2与 。21S统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!21.构造原假设和备择假设 01212:0H2.构造统计量。由于两总体方差相等,且均为正态总体,则可以构造如下检验统计量: 1212()()pXtSn其中 2221()(1)564395.pnS则 4201.8207.314.153.()6t 3.计算临界值。给定显著性水平 ,如 ,计算临界值 ,.05120.5()()tnt由于 5030,则 。0.50.5()14tz4.做出决策。由于 ,故拒绝原假设,即认为 。82612二、1.对于回归模型 , 的最小二乘估计为: 。现在来看它的期YX1()Xy望 111()() ()()EXyEE从上面可以看出,要使 为无偏估计,则必须满足 ,所以只有当 时,()0()0E才为有偏估计。2.使 的原因: ()0E遗漏了关键自变量,即全模型正确时,而我们误用了选模型。用选模型建模时,使得误差项中含有遗漏自变量的信息,从而期望不为零。证明过程如下证明:假设正确模型为 ,令 , 。而我们选用了模YX(,)ptXpt统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!3型 来估计 , 得到 ,则pYX1()ppXy1 1 1()() ( ()(,)ppppptttEEXX从上式可以看出 是 的有偏估计。p加入了无关紧要的自变量,即选模型正确,而我们误用了全模型,这样会过度提取误差项信息,使得估计量有偏。证明过程和上式差不多。这里省略。3.解决办法:在选择自变量时,对因变量有重要影响的自变量尽量考虑全面,但自变量又不是越多越好,应该去掉那些对因变量没有影响或者影响很小的自变量。具体实施办法有前进法、后退法、逐步回归法等。三、是平稳过程,证明如下 1()cos()cos()21 ininsin()20tEXAtAtdAt222222()(cos)(cos)(co)1 (1 cs()sin()4 tVarXrAtEAtEtEdAt tA2222(,)cov(,)()()1 coss21 ()() cossin4 (4tsttttsXEXEdAtt )t统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!4即协方差函数只与 有关。ts由平稳过程的定义知,题中所定义的过程为平稳过程。四、1.先来估计各层总体的方差。在比例估计中定义 1, 1,2.0iiYiN第 个 单 元 具 有 所 考 虑 的 特 征 ( )其 它则可得如下关于总体方差的式子222211()()()11NNi iiSYYPQ从上式我们可以估计出各层的方差 2111()0.5.2, 0.5sps22 2().73., .483N2333(1)0.64., 0.9sps(由于 很大,故省略系数 。 )kN1kN2.考虑样本容量为 600 的简单随机抽样的方差。在简单随机抽样下总体比例的估计量为 30.5180.72.60586p估计量方差的估计值为.4() .759fpqvn3.考虑奈曼分配的情形。设抽取的样本容量为 ,样本量在各层的分配公式为n1hhLWS代入数据得到 10.50.5149.2348.24nn 283. 3.9.050.统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!5则奈曼分配的估计量方差的估计为 2211 ()()4 . .9.48311962.635 .19.2LLhhsthpqpqvpWfnnnnnn4.计算 。要使奈曼分层抽样与简单随机抽样有相同估计量方差,则必须满足n()stvp即0.2356.047n解得9五、略。六、1.来看 的性质t()0tE22var()ttttxco,()()tststs由上可看出,该模型违背古典线性回归模型的方差一致性假设,残差存在异方差性。2.加权最小二乘法。当残差存在异方差时,如果还是用最小二乘法估计参数,会带来严重的后果,如下参数估计值虽是无偏的,但不是最小方差线性无偏估计;参数的显著性检验失效;回归方差的应用效果极不理想。鉴于此,我们必须寻求适当的方法对原来的估计方法进行变换,使变换后的估计方法满足同方差性假设。由于异方差性导致离差平方和 201(,)()niiiQyE中的各项的比重不一样,地位不平等,导致使用普通最小二乘法时,回归线就被拉向方差大的项。而在此题中,残差系列与自变量观测值的平方成正比,即统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!62var()ttx因此当我们在平方和各项前面加入一个权重 时,各项的地位就平等了。从而21/iiw克服了普通最小二乘法的弊端,这就是加权最小二乘法。它实施起来简单,原理清晰,是解决本题最好的方法。七、1.数据分析。在本题中有三个影响因素:时间、活动空间、安眠药。因变量是老鼠的活动状态,可以把它看成数值型变量。要研究的是时间、活动空间、安眠药对老鼠活动状态是否有显著的影响。我的分析思路是:首先,我把数据列成如下的表格吃药后立即记录的数据吃药 不吃药关在一起 1jx12j分开喂养 2jj吃药后一小时记录的数据吃药 不吃药关在一起 1jy12j分开喂养 2jj吃药后两小时记录的数据吃药 不吃药关在一起 1jz12j分开喂养 2jj其中 表示老鼠的编号,每个组有 10 只老鼠。 代表时间。1,2.0j , xyz其次,对每个表格的数据进行有交互作用的方差分析,通过分析得到活动空间、安眠药是否对老鼠活动状态有显著的影响,也可得到它们的交互作用是否对老鼠活动状态有显著的影响。通过在三个观测时间上各自的分析,最后得到安眠药在那个时间点上的效果最好。2.分析步骤。 (和第八题的步骤差不多,这里就不写了。 )注:上述问题属于有重复测量的方差分析问题,它与一般方差分析的不同之处在于它的时间观测值数据之间不是独立的、是相关的。这里将时间分开来处理,似乎有所不妥,特此说明,仅供参考。统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!7八、1.本题中职称和性别都是属性变量,满意度是数值型变量,要研究属性变量对数值型的影响,很自然会想到用方差分析方法,而本题中我们用无交互作用的双因素方差分析方法。问题提出:在分析一个属性变量对一个数值型变量的影响时,我们把属性变量的各个水平各看成一个总体,然后比较这几个总体的均值,看它们是否有显著的差异,如果有显著的差异,则说明在各个水平下得到的数据之间是有差异的,即认为属性变量对数值型变量有显著影响。在本题中,比如我们要研究性别对满意度有无显著影响,我们的思路是把男、女两个水平各看成一个总体,然后根据数据设计一种方法检验它们的均值有无显著的差异,如果没有差异,那么我们认为两总体间的数据没有什么区别,即满意度差异不大,也即性别对满意度没有影响。基本思想:在方差分析中我们假定因素的各个水平服从方差相等正态分布,这样在每个总体下抽取样本,由于抽样的随机性,会导致数据的不同,且各水平之间数据也会不同,我们现在要研究的各水平数据的差异性能完全由抽样的随机性解释吗?如果可以,我们认为个水平均值没有差异;否则,就有差异。具体的做法是,我们引进组内误差和组间误差两个概念,它们分别用组内平方和与组间平方和诠释。如果组间平方和与组内平方和经过平均后的数值相接近,则说明数据间的差异是由抽样的随机性引起的,不存在系统性差异,即属性变量对数值型变量没有影响。分析步骤a.提出假设 012:H, 性 别 对 满 意 度 没 有 影 响行 因 素 假 设 性 别 对 满 意 度 有 影 响0123:,职 称 对 满 意 度 没 有 影 响列 因 素 假 设 不 全 相 等 职 称 对 满 意 度 有 影 响b.构造检验的统计量总误差平方和 21()krijijSTx行因素误差平方和 ,均方误差 21()kriijR 1SRMk列因素误差平方和 ,均方误差 21()krjijSCxCr剩余因素误差平方和 , 均方误差 ETSRC(1)SEMkrF 统计量统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!8(1,)(,(1,)(R CMSMSFkrFrkrEEc.统计决策。给定显著性水平 ,如果 ,则拒绝原假设,说明行因素对观R测值有显著的影响;如果 ,则拒绝原假设,说明列因素对观测值有显著C的影响。2.假定:各个水平对应的总体都服从正态分布;各个总体的方差相同;各观测值是独立的;性别和职称对满意度的影响是独立的,即它们之间没有交互作用。2008 年人大统计学专业课初试题参考解答一、用中位数来描述家庭收入数据的集中趋势有优点亦有不足。1.中位数是指一组数据排序后处于中间位置的变量值,不受极端值影响,对偏斜程度较大的顺序或数值型数据代表性较好,所以它能够排除过高收入或过低收入带来的不良影响。2.作为描述数据集中趋势的指标,中位数的应用远不及平均值广泛,中位数只是一组数统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!9据中的一个值,因而对整个香港家庭收入信息有较大浪费;而平均值能包含所有收入信息,而且具有优良的数学性质,不过它易受极端值的影响,主要适用于测度偏斜度不大的数据。3.用中位数作为判别低收入的指标,那么低收入的比例一直都是 50%,这显然与“比例在增长”相矛盾。二、方差分析表面上是检验多总体均值是否相等,本质上是研究变量间的关系,即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,其中需要分析数据变异的来源,所以叫做方差分析。观察到的数据一般是参差不齐的,我们用 SST(总平方和)度量数据总的变异,将它分解为可追溯到来源的部分变异 SSE(组内平方和)与 SSA(组间平方和)之和,若后者的平均 MSA(组间均方)明显比前者的平均 MSE(组内均方)大,就认为自变量对因变量有显著影响。在方差分析的基本假定下,上述问题形式上就转化为检验各总体均值是否相等的问题。所谓基本假定就是,各总体服从正态分布;各总体方差相同;各观测值相互独立。三、有多种预测模型可供选择:1.时间序列分解模型加法模型: ;tttxTSI乘法模型: ;ttt混合模型: , 。tttxI()tttxTI其中 为时刻 的序列值, , , 分别表示趋势、季节性、随机波动,下同。t ttSt2.季节多元回归模型 01123 t txatbQI趋 势 随 机 波 动季 节 成 分其中 为 0-1 虚拟变量。 (1,23)iQ3. ARIMA(p,q,d,T)模型(求和自回归移动平均模型)2()()0, , ()0 ()dTttttstsBxEVarEt符号说明a. 为一阶延迟算子( ) ;B1ttBxb. 为自回归系数多项式;1() (0)pc. 为移动平均系数多项式;q统计之都 COSCapital Of Statistics IN THE NAME OF STATISTICS, UNITE!10d. 为 阶差分算子,用于消除趋势成分;(1)ddBe. 为步长为周期 的 步差分算子,用于消除季节成分。TT四、 (1)厂家从自身利益出发,当然希望每袋平均重量 ,这样有利于提高产品销量,250g于是可以把 放在“被保护”的位置,而原假设正具有“被保护”的特性,250g于是可提出如下检验假设: 01:25Hg(2)从消费者利益出发,我们担心每袋平均重量 ,如果要我们相信 ,0250g那么厂家就得拿出充分的证据来证明,所以 应放在“不利”的位置,即放25g在备择假设中,于是有: 01:H(3)在 的显著性水平和(2)中的检验假设下, 意味着 是0.5 0.4297p250显著不成立的,即拒绝原假设,我们可以相信厂家所言。值的含义是当原假设为真时,检验统计量取其实现值以及更极端值的概率,它是p检验的真实显著性水平。(4)这里的区间(241.1,257.5)是一个确定的区间,而食品的实际平均重

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论