人大统计学真题07-09_第1页
人大统计学真题07-09_第2页
人大统计学真题07-09_第3页
人大统计学真题07-09_第4页
人大统计学真题07-09_第5页
全文预览已结束

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2009年人大统计学专业课初试题一、有两个正态总体,均值和方差未知,但已知方差相等。从第一个总体中抽取n=16的随机样本,均值为24,方差为64;从第二个总体中抽取n=36的随机样本,均值为20,方差为49。如何检验第一个总体的均值是否大于第二个总体的均值?二、在何种情形下,回归系数的最小二乘估计不具有无偏性?说出原因并指出解决办法。三、周期过程,其中频率和振幅都是常数,而相位是一个在区间-,上服从均匀分布的随机变量。问是否平稳?说明原因。四、把一个总体分为三层,各层的权重和预估的比例见下表。待估计的参数为总体比例。如采用奈曼分层抽样,请说明需要多大的样本容量才能与样本容量为600的无放回简单

2、随机抽样有相同的估计量方差。(假设各层总体单位数量都充分大,忽略“有限总体校正系数”)层总体权重预估的层内总体比例10.50.520.30.730.20.6五、与人大出版社21世纪统计学系列教材之统计学(第二版)第四章习题第10题是一样的。六、若有线性回归模型,其中,则(1)该模型是否违背古典线性回归模型的假定?请简要说明。(2)如果对该模型进行估计,你会采用什么方法?请说明理由。七、测试某种安眠药效果,随机选40只白鼠,将其随机分为20对,再随机分为两组。第一组10对白鼠中每一对的两只分别关在不同的笼中喂养;第二组10对白鼠中每一对的两只关在同一个笼中喂养。每对白鼠中随机抽取一只喂以实验的安

3、眠药,在三个不同的时间点记录每只白鼠的活动情况:吃药后立即记录,吃药后一小时记录,吃药后两小时记录。对于不吃药的白鼠,记录时间与同一对中另外一只白鼠的记录时间相同。假定40只白鼠的初始活动状态相同。请详细阐述你用何种方法分析安眠药的效果?八、某大学从教师中抽取一个随机样本进行满意度调查。1分表示非常不满意,100分表示非常满意。数据汇总如下表,欲分析教师职称和性别对满意度有无显著性影响,则(1)你会选择什么分析方法?简述你的分析思路(可用公式说明,不需计算结果)。(2)要采用该分析方法,数据必须满足哪些几本假定?请加以说明。职称男女调查人数满意度调查人数满意度教授30883082副教授3083

4、3080讲师307430752008年人大统计学专业课初试题一、(10分)07年香港一则报道说:“随着经济的增长,香港低收入家庭的比例在增长,其中低收入的家庭是指低于中位数的家庭。”请你从统计的角度对该报道做简要评论。二、(10分)经常有人说方差分析是比较多个总体的均值是否相同,但为什么叫方差分析呢?请谈谈你对方差分析的理解,并说明方差分析解决问题的基本思路。三、(10分)如果时间序列在随时间变化的过程中既有趋势又有季节变动,你认为可以建立什么样的预测模型?请你写出模型形式并加以简要说明。四、(30分)食品厂家说:净含量是每袋不低于250g。但有消费者向消协反映不是250g,消协据此要求厂家自

5、检,同时消协也从中随机抽取20袋检验。 (1)如果厂家自己检验,你认为提出什么样的原假设和备择假设?并说明理由; (2)如果从消费者利益出发,你认为应该提出什么样的原假设和备择假设?并说明理由; (3)消协抽取20袋,数据如下(略),得p值为0.4297,在=0.5的显著水平下,检验假设意味着什么?p值的含义是什么?(4)据样本数据得该食品每袋平均重量95%置信区间(241.1,257.5),你认为这种食品实际平均重量是否在该区间?为什么?五、(15分)在经典的多元线性回归模型里,针对自变量事实上是有许多假设的。(1)请具体指明这些假设有哪些?(2)说明这些假设所发挥的主要作用;(3)请讨论这

6、些假设最终产生的影响。六、(15分)在有关统计知识方面内容的中学课本里编者认为基本的抽样方式只有三种,并不包括整群抽样,请说明你赞同与否并详列理由。七、(30分)叙述贝叶斯判别分析的原理(包括完整的假设)并说明:(1)与聚类分析相比,贝叶斯判别分析赖以进行的数据结构有何特点?(2)与其他判别分析相比,贝叶斯判别分析结果的表现形式有何不同?八、(30分)在诸如大坝、码头等工程设计中,坝高和码头高度的确定十分关键,要考虑许多因素。(1)以大坝为例,概略说明需考虑的主要因素;(2)大坝高度通常利用长期洪水历史记录数据,依据几十年一遇的标准确定,请写出计算坝高详细的具体步骤。(画出框图,并尽量避免过多

7、使用文字)2007年人大统计学专业课初试题一、(20分)下面是一种零件误差的数据(单位:克):6.1 4.7 6.5 6.2 7.76.4 5.5 7.1 6.1 5.35.7 6.1 5.3 4.0 4.83.2 3.9 1.9 4.9 3.85.3 2.6 5.3 5.5 5.82.7 6.8 7.4 5.6 3.3 (1)根据涉及t分布的计算,该数据所代表的总体均值的95%置信区间为(4.637785,5.728882)。请问,若使该置信区间有意义,需要对总体进行何等假定?这种假定能不能用数据证明?是不是该区间以0.95的概率覆盖真实总体均值?如果不是,说出理由及合适的说法; (2)对于

8、该数据所代表的总体的均值进行检验:零假设为总体均值等于4.8克,备选假设为总体均值大于4.8克。如果进行t检验,需要假定哪些条件?t检验结果为p值等于0.0807。能不能说“在显著性水平为0.05时,接受零假设”?为什么?你的结论是什么?二、(20分)一家研究机构想估计在30个网络公司工作的员工每周加班的平均时间,为此进行抽样调查。请回答以下问题: (1)如果对这些员工进行随机电子邮件调查,由答复的邮件所得到的数据是不是简单随机样本?为什么? (2)抽样调查中,说“响应误差总是人们不说实话导致的”对不对?为什么?随机误差是不是可以避免的? (3)这些员工的加班时间是否独立?如果不是,原因可能是

9、什么? 三、(20分)某城市交通管理部门的一项调查表明,该城市中驾车上班的人数超过30%。但一家研究机构则认为自驾车上班的人数比例达不到这一水平。为证明自己的这一看法,该研究机构准备抽取一个简单的随机样本进行检验。 (1)请写出检验的原假设和备择假设; (2)请对小样本情况写出计算p值的公式,并论述你所依赖的分布。对大样本情况,写出检验统计量的公式以及使该统计量有意义所需要的假定的条件; (3)对于一般检验来说,如果结果表明“统计上显著”,是不是实际上也显著? 四、(10分)在对某项产品的认可的抽样调查报告中,如果报告仅仅说,“对该产品认可的有90%”,那么该报告是否负责?一个负责任的调查报告

10、应该给什么有关信息? 五、(10分)对于主成分分析,有人在进行了主成分分析之后,对得到的主成分又进行了第二次主成分分析,以得到更加精确的结果。请问,这样做是否有道理?请加以说明。什么样的数据不适宜于主成分分析?选择那些主成分累计方差贡献率为70-80%之类的准则是不是总是适用?为什么? 六、(20分)回归模型y=0+1x1+2x2+pxp+中的一定是随机误差吗?如果回答是否定的,讨论在何种情况下,答案是肯定的?此外,最小二乘回归是不是需要对误差项作出假定?如果不是,那么在什么情况下需要对误差项作出假定?作什么假定? 七、(25分)对于聚类分析,请回答以下问题: (1)分层聚类前,需要对什么进行

11、选择? (2)描述分层聚类分析的详细步骤; (3)描述K均值(快速)聚类分析的详细步骤。 八、(25分)应用多元线性回归模型y=0+1x1+2x2+pxp+,如果一个SPSS回归分析的结果如下表所示:ANOVAModelSum of SquaresdfMean SquareFSig.1RegressionResidualTotal106831048750.12431085446686.216137916495436.340 1472473106831048750.12465858997.2171622.118.000a2RegressionResidualTotal111136313278.11826780182158.221137916495436.340 2471473 55568156639.05956858136.217997.312.000ba. Predictors:(Consta

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论