版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计之都 COSCapital Of Statistics 人大统计学考研历年真题参考解答精华版(03-09)2009年人大统计学专业课初试题参考解答一、设第一、二个总体均值分别为与,样本均值分别为与,样本方差分别为与。1.构造原假设和备择假设2.构造统计量。由于两总体方差相等,且均为正态总体,则可以构造如下检验统计量:其中则3.计算临界值。给定显著性水平,如,计算临界值,由于50>30,则。4.做出决策。由于,故拒绝原假设,即认为。二、1.对于回归模型,的最小二乘估计为:。现在来看它的期望从上面可以看出,要使为无偏估计,则必须满足,所以只有当时,才为有偏估计。2.使的原因: 遗漏了关键
2、自变量,即全模型正确时,而我们误用了选模型。用选模型建模时,使得误差项中含有遗漏自变量的信息,从而期望不为零。证明过程如下证明:假设正确模型为,令,。而我们选用了模型来估计,得到,则从上式可以看出是的有偏估计。加入了无关紧要的自变量,即选模型正确,而我们误用了全模型,这样会过度提取误差项信息,使得估计量有偏。证明过程和上式差不多。这里省略。3.解决办法:在选择自变量时,对因变量有重要影响的自变量尽量考虑全面,但自变量又不是越多越好,应该去掉那些对因变量没有影响或者影响很小的自变量。具体实施办法有前进法、后退法、逐步回归法等。三、是平稳过程,证明如下 即协方差函数只与有关。由平稳过程的定义知,题
3、中所定义的过程为平稳过程。四、1.先来估计各层总体的方差。在比例估计中定义则可得如下关于总体方差的式子 从上式我们可以估计出各层的方差(由于很大,故省略系数。)2.考虑样本容量为600的简单随机抽样的方差。在简单随机抽样下总体比例的估计量为估计量方差的估计值为 3.考虑奈曼分配的情形。设抽取的样本容量为,样本量在各层的分配公式为代入数据得到则奈曼分配的估计量方差的估计为4.计算。要使奈曼分层抽样与简单随机抽样有相同估计量方差,则必须满足即 解得 五、略。六、1.来看的性质由上可看出,该模型违背古典线性回归模型的方差一致性假设,残差存在异方差性。2.加权最小二乘法。当残差存在异方差时,如果还是用
4、最小二乘法估计参数,会带来严重的后果,如下参数估计值虽是无偏的,但不是最小方差线性无偏估计;参数的显著性检验失效;回归方差的应用效果极不理想。鉴于此,我们必须寻求适当的方法对原来的估计方法进行变换,使变换后的估计方法满足同方差性假设。由于异方差性导致离差平方和中的各项的比重不一样,地位不平等,导致使用普通最小二乘法时,回归线就被拉向方差大的项。而在此题中,残差系列与自变量观测值的平方成正比,即因此当我们在平方和各项前面加入一个权重时,各项的地位就平等了。从而克服了普通最小二乘法的弊端,这就是加权最小二乘法。它实施起来简单,原理清晰,是解决本题最好的方法。 七、1.数据分析。在本题中有三个影响因
5、素:时间、活动空间、安眠药。因变量是老鼠的活动状态,可以把它看成数值型变量。要研究的是时间、活动空间、安眠药对老鼠活动状态是否有显著的影响。我的分析思路是:首先,我把数据列成如下的表格吃药后立即记录的数据吃药不吃药关在一起分开喂养吃药后一小时记录的数据吃药不吃药关在一起分开喂养吃药后两小时记录的数据吃药不吃药关在一起分开喂养其中表示老鼠的编号,每个组有10只老鼠。代表时间。其次,对每个表格的数据进行有交互作用的方差分析,通过分析得到活动空间、安眠药是否对老鼠活动状态有显著的影响,也可得到它们的交互作用是否对老鼠活动状态有显著的影响。通过在三个观测时间上各自的分析,最后得到安眠药在那个时间点上的
6、效果最好。2.分析步骤。(和第八题的步骤差不多,这里就不写了。)注:上述问题属于有重复测量的方差分析问题,它与一般方差分析的不同之处在于它的时间观测值数据之间不是独立的、是相关的。这里将时间分开来处理,似乎有所不妥,特此说明,仅供参考。八、1.本题中职称和性别都是属性变量,满意度是数值型变量,要研究属性变量对数值型的影响,很自然会想到用方差分析方法,而本题中我们用无交互作用的双因素方差分析方法。问题提出:在分析一个属性变量对一个数值型变量的影响时,我们把属性变量的各个水平各看成一个总体,然后比较这几个总体的均值,看它们是否有显著的差异,如果有显著的差异,则说明在各个水平下得到的数据之间是有差异
7、的,即认为属性变量对数值型变量有显著影响。在本题中,比如我们要研究性别对满意度有无显著影响,我们的思路是把男、女两个水平各看成一个总体,然后根据数据设计一种方法检验它们的均值有无显著的差异,如果没有差异,那么我们认为两总体间的数据没有什么区别,即满意度差异不大,也即性别对满意度没有影响。基本思想:在方差分析中我们假定因素的各个水平服从方差相等正态分布,这样在每个总体下抽取样本,由于抽样的随机性,会导致数据的不同,且各水平之间数据也会不同,我们现在要研究的各水平数据的差异性能完全由抽样的随机性解释吗?如果可以,我们认为个水平均值没有差异;否则,就有差异。具体的做法是,我们引进组内误差和组间误差两
8、个概念,它们分别用组内平方和与组间平方和诠释。如果组间平方和与组内平方和经过平均后的数值相接近,则说明数据间的差异是由抽样的随机性引起的,不存在系统性差异,即属性变量对数值型变量没有影响。分析步骤a.提出假设b.构造检验的统计量总误差平方和 行因素误差平方和,均方误差 列因素误差平方和,均方误差 剩余因素误差平方和,均方误差 F统计量 c.统计决策。给定显著性水平,如果,则拒绝原假设,说明行因素对观测值有显著的影响;如果,则拒绝原假设,说明列因素对观测值有显著的影响。2.假定:各个水平对应的总体都服从正态分布; 各个总体的方差相同; 各观测值是独立的; 性别和职称对满意度的影响是独立的,即它们
9、之间没有交互作用。2008年人大统计学专业课初试题参考解答一、用中位数来描述家庭收入数据的集中趋势有优点亦有不足。 1.中位数是指一组数据排序后处于中间位置的变量值,不受极端值影响,对偏斜程度较大的顺序或数值型数据代表性较好,所以它能够排除过高收入或过低收入带来的不良影响。 2.作为描述数据集中趋势的指标,中位数的应用远不及平均值广泛,中位数只是一组数据中的一个值,因而对整个香港家庭收入信息有较大浪费;而平均值能包含所有收入信息,而且具有优良的数学性质,不过它易受极端值的影响,主要适用于测度偏斜度不大的数据。 3.用中位数作为判别低收入的指标,那么低收入的比例一直都是50%,这显然与“比例在增
10、长”相矛盾。二、方差分析表面上是检验多总体均值是否相等,本质上是研究变量间的关系,即通过各总体均值是否相等来判断分类型自变量对数值型因变量是否有显著影响,其中需要分析数据变异的来源,所以叫做方差分析。观察到的数据一般是参差不齐的,我们用SST(总平方和)度量数据总的变异,将它分解为可追溯到来源的部分变异SSE(组内平方和)与SSA(组间平方和)之和,若后者的平均MSA(组间均方)明显比前者的平均MSE(组内均方)大,就认为自变量对因变量有显著影响。在方差分析的基本假定下,上述问题形式上就转化为检验各总体均值是否相等的问题。所谓基本假定就是,各总体服从正态分布;各总体方差相同;各观测值相互独立。
11、三、有多种预测模型可供选择:1.时间序列分解模型 加法模型:;乘法模型:;混合模型:,。其中为时刻的序列值,分别表示趋势、季节性、随机波动,下同。2.季节多元回归模型 其中为0-1虚拟变量。3. ARIMA(p,q,d,T)模型(求和自回归移动平均模型) 符号说明 a. 为一阶延迟算子();b. 为自回归系数多项式;c. 为移动平均系数多项式;d. 为阶差分算子,用于消除趋势成分;e. 为步长为周期的步差分算子,用于消除季节成分。四、(1)厂家从自身利益出发,当然希望每袋平均重量,这样有利于提高产品销量,于是可以把放在“被保护”的位置,而原假设正具有“被保护”的特性,于是可提出如下检验假设:
12、(2)从消费者利益出发,我们担心每袋平均重量,如果要我们相信,那么厂家就得拿出充分的证据来证明,所以应放在“不利”的位置,即放在备择假设中,于是有: (3)在的显著性水平和(2)中的检验假设下,意味着是显著不成立的,即拒绝原假设,我们可以相信厂家所言。 值的含义是当原假设为真时,检验统计量取其实现值以及更极端值的概率,它是检验的真实显著性水平。 (4)这里的区间(241.1,257.5)是一个确定的区间,而食品的实际平均重量要么在其中,要么不在其中,无概率可言。该区间是95%的随机置信区间的一个实现,后者的意思是食品的实际平均重量以95%的概率落入其中。五、经典多元线性回归模型为 其中是维随机
13、向量,是设计矩阵,是维系数向量,是维随机误差向量。 关于自变量的假设主要有:1.自变量都是确定性变量。回归分析中的自变量与因变量地位是不等的,其中后者是随机的,这与相关分析二者都是随机的不同。从而自变量与随机误差(以及因变量)也就不相关,保证了回归分析理论的顺利进行。2.自变量不存在多重共线性。这就要求设计矩阵列满秩,进而观测次数(样本量)必须大于自变量个数。该假设保证了的普通最小二乘估计可表示为 并且具有良好的数学性质,更方便了进一步的假设检验和回归分析的实际操作与应用。否则出现多重共线性,就会带来上述诸多方面的麻烦。六、常见的(概率)抽样方式有简单随机抽样、分层抽样、整群抽样、多阶段抽样和
14、系统抽样,其中简单随机抽样是最基本的,是其他抽样方式的基础。所谓基本抽样方式,我觉得以不同的标准或不同的思维角度会得出不同的分类方式,比如: 1.如果将整群抽样(通常指一阶)看作特殊的二阶段抽样(二阶段抽样比100%),则有四种基本抽样方式。 2.如果又将分层抽样视为特殊的二阶段抽样(一阶段抽样比100%),则有三种基本抽样方式。 3.如果将系统抽样看作特殊的分层抽样(每层抽一个单元)或者特殊的整群抽样(只抽一个群),则有四种基本抽样方式。七、贝叶斯判别分析的原理是将贝叶斯统计思想用于判别分析。具体说来,设有个总体,分别有密度函数(一般假定总体都服从正态分布,协方差阵都相等,各均值有显著差异)
15、,已知出现这个总体的先验概率为。我们希望给出一种判别法,也就是给出空间的一种划分:,当落入时,将其判给,使得在该判别法下所带来的平均损失达到最小。其中为样品来自而被判给的错判损失,为错判概率。(1)与聚类分析数据都是未知类别的相比,贝叶斯判别分析的数据结构中有一部分数据是已知类别的,还有一部分属于待判别归类的未知类别的。(2)贝叶斯判别法最终是将样品判给平均损失最小的总体。而其他判别法,比如距离判别法是将样品判给相距最小的总体;逐步判别法是先选择最优判别变量,再结合其它判别法进行判别等等。八、(1)建造大坝是一项复杂的工程,要综合水利、建筑、地质、数学、统计等多学科的知识,要考虑方方面面的因素
16、。就其中坝高设计这一点来说,要考虑的主要因素我认为有河流宽度与两岸高度、周围地质构造、河水各季度平均流量、地域旱涝特征,还有建坝的预估资金和时间等等。 (2)具体步骤如下: 制定计算坝高的详细计划;确定影响坝高的主要指标;充分收集整理指标数据;综合利用各学科知识建立坝高数学模型;检验优化模型;利用模型计算坝高估计值,给出置信度和置信区间。流程图如下:2007年人大统计学专业课初试题参考解答一、(1)需假定总体是正态总体。 不能用数据证明。数据至多只能检验该数据的分布是否接近正态分布,而不能从理论上证明或肯定它一定就来自正态分布总体,即正态性检验不能提供不拒绝正态性原假设的结论。不是。该区间是确
17、定的区间,要么覆盖真实总体均值,要么不覆盖,没有概率可言。它是置信度为95%的随机置信区间的一个样本实现,后者才是以95%的概率覆盖真实总体均值。 (2)需假定:总体服从正态分布;总体方差未知;样本量较小(一般30)。 不能。“接受零假设”的说法是不妥的,否则就得负责任的给出犯第二类错误的概率,而该检验的备选假设是“总体均值>4.8克”,据此是无法算出此概率的。所以只能说,在显著水平为0.05时利用该数据进行检验不足以拒绝零假设,不拒绝不等同于接受。二、(1)不是。因为只有员工看到并愿意答复电子邮件时才有机会进入样本,所以每个员工入样的概率并不一样,这其实是一种非概率抽样。 (2)不对。
18、不说实话只是产生响应误差的原因之一,而被调查者与调查者两方面的因素,都有可能导致响应误差。调查者不当的引导或者问卷设计不科学或者被调查者知识的局限性,都可能使被调查者对要回答的问题的理解产生偏差,这时候即使他(她)说了“实话”,也会产生响应误差,因为这不是我们想要的“实话”。另外,拒绝回答也是一种重要原因。随机误差是不可以避免的,因为它是由抽样的随机性造成的,是客观的。 (3)整体来说是不独立的。因为同一个网络公司员工加班时间一般是不独立的,而不同网络公司员工加班时间一般是独立的。三、(1)令自驾车上班人数比例为,由于不能轻易否定原结论,则检验假设为: (2)令样本量为,其中驾车上班人数为,假
19、定服从二项分布,的样本值为,则检验统计量。 假定:大样本();每人驾车上班与否相互独立且服从同参数0-1分布。 (3)统计上显著并不意味着实际上显著,要具体问题具体分析。比如,某箱牛奶经统计检验,含三聚氰胺的概率显著低于5%,但人们未必敢要这箱牛奶;统计上0.1与0.01有显著差异的时候,实际中未必有多大意义。不过统计显著与实际显著很多时候是一致的。四、不负责。一个负责任的调查报告应该给出较详尽的内容,主要如下:主题; 调查时间与地点; 调查主题、客体、对象; 数据搜集方法、抽样框、抽样单元、样本量、抽样方法、估计方法;结论描述; 精度、质量评估; 责任; 参考文献。五、无道理。如果进行第二次
20、主成分分析,那么它处理的变量是第一次主成分分析得到的互不相关的主成分,这样得到的“新”的主成分其实跟第一次得到的主成分是完全一样的,这可以通过矩阵运算进行验证,所以做的是无用功。变量之间相关系数多数较小(一般指<0.3)的数据不宜进行主成分分析。不总是适用。要具体问题具体分析,不能拘泥于某些固有的准则,有时候还要根据问题的实际意义或专业理论知识来分析。六、不一定。只有当所有对因变量产生影响的自变量都考虑进来了而且不存在自相关、异方差等情况时,才是随机误差。不需要。如果要研究最小二乘估计量性质的话,就得假定满足Guass-Markov条件;若还要进行回归系数区间估计和有关假设检验,则要进一
21、步假定。七、(1)需要选择度量样品或指标相似性的统计量,通常是距离(欧式距离、马氏距离等)或相似系数(夹角余弦、相关系数等)。然后还要定义样品间、类与类间的距离或相似系数。 (2)计算n个样品两两间的距离;构造n个类,每个类只包含1个样品;合并距离最近的两类为1新类;计算新类与其它类之间的距离;判断类的个数是否为1,是则进入第步,否则返回第步;画谱系聚类图;决定分类个数和各类成员。 (3)把样品粗略分成K类;以上述K类的均值为种子,按照到它们距离的远近把所有点分成新的K类;反复进行第步,直至收敛,得到最终的K类。八、(1)可能是前进法或逐步回归法。由表可知,选元进行了两步,第一步选了自变量Be
22、ginning Salary,第二步增加了另一自变量Employment Category。前进法显然解释得通。至于逐步回归法,因为只进行了两步,而它的第二步不考虑剔除,故可以得到与前进法完全一样的结果。 (2)就是通常所说的值,其计算公式为 这里的是原假设成立时服从分布的检验统计量,是的样本值,即表中的1622.118和997.312。 的意义就是,原假设为真时,统计量取其样本实现值以及更极端值的概率,是检验的真实显著性水平。 (3)假定:;原假设成立。 证明:可知。 由数理统计知识,在假定成立时,有 在假定成立时,有 且与是相互独立的,故 证毕。2006年人大统计学专业课初试题参考解答一、
23、(1)图略。 (2)第二种排队方式平均等待时间 其中为第一种排队方式平均等待时间。 第二种排队方式的方差 其中为第一种排队方式的方差。 可知第二种排队方式比第一种排队方式离散程度小。 (3)我会选择第二种排队方式。以为它的平均等待时间较短,等待时间也较稳定。二、(1)样本量为50,可认为是大样本,由中心极限定理知 其中为样本均值,为总体均值,为样本标准差。 由 得到95%的置信区间代入样本数据计算得 所求置信区间为 即 (2)由表可知样品中超过的食品包数占大多数,厂家的观点似乎有一定的可信度,故令检验假设为 (3)P值是当原假设为真时,得到所观测结果或更极端结果的概率,是检验的真实显著性水平,
24、可利用P值直接决策或将P值与显著性水平进行比较,不需要查表,具有可比性;统计量检验是先确定一个显著性水平从而获得一个否定域,进行决策的界限清晰但面临的风险是笼统的,确定临界值要查表,检验统计量一般与自由度有关因而可比性较差。三、(1)这是无交互作用双因素方差分析问题,由行、列自由度可知行因素是供应商,列因素是车速。 列的F检验值97.68>F临界值8.65,P值0.000002<<显著性水平=0.01,故拒绝原假设,即认为车速对磨损程度有显著影响。 (2)同(1)之理,可知不同供应商的轮胎之间的磨损程度有显著差异。 (3)假设:车速与供应商对轮胎的磨损程度无交互作用;车速与供
25、应商不同水平组合形成的总体都是正态总体;上述总体方差都相同;各观测数据相互独立;行因素原假设;列因素原假设。四、简单随机抽样是从单元数为N的总体中逐个不放回等概率抽取n个单元或者一次性随机抽出n个单元,得到简单随机样本。它是最简单的概率抽样方法。适用于总体总量较小或总体方差与任意局部方差基本相当的场合。如果总体总量较大或总体各单元差异较大,就不宜单独使用,因为此时拥有完整的抽样框是困难的,抽样单元也比较分散,会增加调查费用,而且会使总体目标量的估计产生较大误差。所以一般是与其他方法结合使用,比如分层抽样各层内科采用简单随机抽样,整群抽样抽取群、多阶段抽样各阶的抽样也都可采用它。五、回归模型:。
26、 假设:解释变量为非随机变量;解释变量不存在多重共线性(即要求设计矩阵列满秩,样本量大于自变量个数); Guass-Markov假定:;正态假定:。假设不成立之应对:假设是回归分析基本要求,否则就不是回归分析;假设若不满足,就是多重共线性现象。有多种克服方法,比如剔除不重要自变量,增大样本量,对回归系数进行有偏估计(主成分法、岭回归法、偏最小二乘法等)等等。假设若不满足,随机误差有可能出现异方差现象或自相关现象。若是前者,可通过加权最小二乘法、Box-Cox变换法、方差稳定性变换等方法来克服;若是后者,可通过修改模型、增加自变量、迭代法等方法来克服。假设若不满足,则无法进行参数区间估计和假设检
27、验。可以重新观测数据或对数据进行正态性变换。六、意义:该模型表示原始变量被表示为公共因子和特殊因子的线性组合,展现了原始变量与公共因子之间的相关关系,多数的原始变量(个)被综合少数的新变量(个,)公共因子,起到了降维的效果,简化了问题的复杂性又抓住了问题的主要矛盾。假设:a.是可观测的随机向量,;b.是不可观测的随机向量,;c. ,;d. 。七、(1)若不考虑国外部门的影响,GDP被分配于政府、企业、居民三个部门。(可以对原始收入形成、初次分配、再分配过程进行一定的阐述) (2)略。八、(1)参看高敏雪,李静萍.经济社会统计M.北京:中国人民大学出版社, 2003之P75-P76财务统计分析,
28、P78经济效益考核体系。 (2)略。2005年人大统计学专业课初试题参考解答一、(1)图略。 (2)图略。 (3)由茎叶图和箱线图知,上网者年龄主要集中在20-30岁之间,离散程度较小,呈右偏分布。二、若采用两两配对的方式检验,会增加犯第一类错误的概率(设检验水平为,连续作3次两两检验犯第一类错误的概率为),另外随着检验次数的增多,偶然因素导致差别的可能性也会增加;而方差分析是同时考虑所有样本,因而排除了错误的累积,减少了偶然因素的不利影响,也简化了检验过程。三、(1)样本量为36,可视为大样本,考虑如下95%的置信区间 代入,得 (2)不一定。因为区间是一个确定的区间,餐馆实际月平均用水量要
29、么在其中,要么不在其中,两者只有其一。区间其实是区间的一个样本实现,区间是一个随机区间,它有95%的可能性包含餐馆实际月平均用水量。 (3)餐馆管理协会估计的月平均用水量=100吨是不能轻易否定的,应处于被“保护”位置,则检验假设为 若拒绝原假设,也就是发生了小概率事件,那么我们有充分的理由支持备择假设;若不拒绝原假设,并不意味着它就一定正确,只是现有证据不足以拒绝它而已。 (4)用到了中心极限定理。它说的是独立同分布随机变量之和的极限分布是正态分布,揭示了正态分布的源泉和重要地位,是参数区间估计和假设检验的理论基础。四、(1)线性回归方程为 其中第个回归系数的意义是,在其它自变量保持不变时,
30、每变动一个单位,就平均变动个单位。 (2)由值=0.00<知,回归方程的线性关系是显著的。 (3)第1,2,3个回归系数显著性检验值分别是0.0271<,0.0083<,0.3607< 故第1,2个回归系数显著,第3个回归系数不显著。 (4)多重判定系数 它反映了因变量变异中能用自变量解释的比例,描述了回归直线拟合样本观测值的优劣程度。此处,表明回归拟合效果很好。 (5)估计标准误差 是的标准差的股价,反映了(房地产销售价格)的波动程度。 (6)有用。虽然该变量的系数没通过显著性检验,但并不意味着该变量没用,它在经济解释上可能还是有一定意义的,方程总体显著,说明方程包含
31、该变量总体上是有用的。也可能是多重共线性造成了不显著。五、(1)图略。 (2)按照分层的观点,划分子总体应该是两个子总体之间的差异尽量大,而子总体内部的差异尽量小,故划分方式为:第一个子总体为,第二个子总体为。但如果要进行精度的计算,不能出现一个总体只含有一个单元的情况,故为了计算精度,下面的划分方式也是可以接受的:第一个子总体为,第二个子总体为。此外也可以应用多元统计中的系统聚类法形成两个子总体:第一个子总体为,第二个子总体为。 (3)上述数据出现了离群值,它是调查数据里的极端值,会于其它数据明显不一致。其起因一般有三个: 被调查者回答有误;调查者记录有误;数据本身的差异。当总体呈偏态分布时
32、,这种情况就可能发生。例如数据是不同公司的市场份额,那么少数公司占整个销售额的绝大部分,其余公司占小部分的情况是很普遍的。但是,题目强调了给定的数据是总体的全部真实数据,那么第、种情况是不存在的,所以应该是第种情况。 (4)总体均值 总体方差 (5)在本例应用的四种方法:简单随机抽样的不足之处在于估计精度略低。分层抽样的不足之处在于如果按照最优的层内差距尽量小、层间差距尽量大的原则(2)之)分层会导致精度无法估计,故只能选择次优分层方法(2)之)。整群抽样的不足之处在于无法通过分群使群间差异尽量小,因为在任何一个群中都会使该群与其它群差异较大。此外整群抽样的估计精度一般也比简单随机抽样低;系统
33、抽样的不足之处在于估计量方差的估计相对困难。综上所述,尽管各种抽样方式各有不足之处,但是结合下面一道问题,我认为简单随机抽样、分层随机抽样和系统抽样的不足之处都可以接受,但是整群抽样的不足之处相对显著,而且整群抽样在下面一道题里计算也非常困难,所以整群抽样最不合适。 (6)简单随机抽样 可能的样本:; 样本均值:; 样本方差:。分层随机抽样 分层方式为(2)之。 可能样本:; 样本均值:; 样本方差:。系统抽样 抽样方式为环形等距抽样()。可能样本为: 样本均值:; 样本方差: (7)简单随机抽样。 分层随机抽样。 系统抽样。 分层随机抽样和系统抽样的设计效应均小于1,说明这两种方式在此情景下
34、的抽样效率要高于简单随机抽样。此外,说明分层随机抽样的效率高于系统抽样。由于远小于1,说明此情形下分层随机抽样的效率远高于简单随机抽样。而接近于1,说明系统抽样的效率接近于简单随机抽样。六、联系:形式接近。,;确定方式接近。回归估计中若未知,则。 区别:目的不同。回归方法揭示因变量和自变量的线性依赖关系,即因变量变化引起的自变量变化。抽样里则是利用辅助变量X来提高对Y的估计精度。七、生产过程提供了用于分配的增加值。分配在生产的基础上对增加值进行分配。使用在分配基础上进行消费和储蓄。八、(1)A地贫困者比重20% 。B地贫困者比重10%。A地贫困深度。 B地贫困深度。(2)A地贫困者人数比B地多
35、,但是由贫困深度反映出A的贫困人员在整体收入水平上比B地更接近贫困线。(3)不能,贫困者比重仅能反映人数,不能反映贫困程度;贫困深度反映了一定的贫困程度,但是受贫困情况分布影响较大,不能很好的反映当贫困者的收入存在较大差异时的情况。此外仅靠收入状况也不能客观地反映贫困状况。可以采用森贫困系数,也可采用其他指标作为补充,如文盲率、婴儿死亡率等等。九、(1)40 ,-70 ,-30。 (2)交易中经常账户和资本金融账户的盈余,进入储备资产,也即储备资产增加125亿元。 (3)GDP+来自国外的生产要素净额=GNP,即GDP+40=GNP。 GNP+来自国外的转移净收入=国民可支配收入,即GNP-6
36、5=国民可支配收入。 (4)该国在货物和服务以及财产收入方面有较大的顺差,储备资产增加,多余资金流出到国外各地投资,取得大量的财产收入,是发达国家的典型表现。2004年人大统计学专业课初试题参考解答1.(1)图略。(2)分三方面比较:集中趋势(平均数、中位数、众数),离散程度(标准差、方差、极差),分布形态(峰度、偏斜度)。(3)可画散点图直观判断;也可计算与均值的绝对距离,看是否偏大。(4)可画画直方图、Q-Q或P-P图;也可计算峰度与偏斜度。2(1)420,2,1.48;27,142;4256。 (2)因为,所以不能拒绝均值相等的原假设,即认为三种方法组装的产品数量之间无显著性差异。 (3
37、)假定:三种方法对应的总体服从正态分布;各总体方差相同;各观测值相互独立;个工人水平相当。 (4)前提:方差分析得出总体均值不全相等的结论; 作用:进一步分析到底是哪些均值之间不相等,是通过总体均值之间两两配对比较来进行检验的。3(1)从袋中任取一球,观察其颜色,定义随机变量 就是该问题的总体,其分布为(2)样本量。(3)若令表示第次取球的结果,则样本为,拒绝域为 (4)犯第一类错误的概率 4. 以单因素方差分析说明:由方差分析基本假定,有。令,有。令总均值,有(其中称为第个水平的(主)效应,它表示每个自变量对因变量的单独影响),得单因素方差分析模型举例略。5.正态线性回归模型为 最小二乘估计就是寻找,使得离差平方和 达到最小。 由上述模型知 似然函数就是随机向量的联合概率密度 最大似然估计就是寻找使得达到最大,由上式易知,这只需 达到最小,这与最小二乘估计殊途同归。证毕。6-10略。2003年人大统计学专业课初试题参考解答一、 不能。GDP在进行国家间比较的时候采用汇率法,汇率的变动会影响折算后的结果,不能客观反映经济水
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 包含技术培训的服务合同
- 2024年简易立体停车设备租赁
- 房屋买卖合同的效力及无效情形探讨
- 2024年二手车交易协议书案例
- 2024专业版商业合作协议书特点
- 工业园区企业员工劳动合同
- 广告投放合同书撰写指南
- 代理招生业务合作协议
- 2024年购买服务的合同
- 厦门市商品房预订协议
- 中小学学校人防、物防、技防落实方案
- 2023湖南文艺出版社五年级音乐下册全册教案
- 2024-2025学年苏教版小学四年级上学期期中英语试题及解答参考
- DLT 5707-2014 电力工程电缆防火封堵施工工艺导则
- 广东省佛山市南海区2024年七年级上学期期中数学试题【附参考答案】
- 小红书2024年家装行业月报(9月)
- 安徽省芜湖市2024年部编版初中九年级期中考试语文试卷
- 劳动合同书中英文LaborContract
- 管理房屋拆除工程投标方案(技术方案)
- 2024年成人高等教育学士学位英语水平考试大纲
- 公安基础知识辅警考试1000题
评论
0/150
提交评论