统计学试卷2014年_第1页
统计学试卷2014年_第2页
统计学试卷2014年_第3页
统计学试卷2014年_第4页
统计学试卷2014年_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中央财经大学2013-2014学年第二学期《统计学》试题专业 学号 姓名 注意事项:1.考试中可以使用计算器。2.本试卷共有四道大题,请不要漏答。3.考试时间为110分钟,请注意合理分配考试时间。4.答题中可能用到的部分公式已经附在试卷末尾供参考。5.试卷不得带出考场,交卷时请将试卷和答题纸分开。可以把试卷的空白处用作草稿纸,不另附草稿纸。所有假设检验中显著性水平a都取为0.05,不再另行说明。8■评分只以答题纸为准,请将所有答案写在答题纸对应的位置上或者写清题号,答题纸背面也可以答题。一、单项选择题(选出最为恰当的一项。每题1分,共20分。)为了估计全国高中学生的平均身高,利用整群抽样的方法,从20个城市中选取了100所中学进行调查。在该项研究中,样本是()。A、100所中学 B、20个城市C、全国的高中学生 D、100所中学的高中学生“您的父母具有大学本科学历吗?”这一问题的设计( )。A、没有任何问题B、措辞不准确 C、包含了多个问题 D、属于诱导性的问题一组数据的偏度系数接近0,峰度系数为-2.5,则该数据的统计分布应具有( )特征。A、扁平分布 B、尖峰分布C、左偏分布 D、右偏分布道琼斯指数是按照I=vPtn的公式计算的,这一指数的编制方法为( )。pvp.nA、拉氏指数法 B、帕氏指数法C、调和平均指数法 D、简单指数法我国的居民消费价格指数是采用()计算的。A、拉氏价格指数公式B、帕氏价格指数公式C、固定加权指数公式 D、简单指数公式系统聚类分析中计算个体之间的距离可以使用的方法是()。A、最短距离 B、最长距离 C、平均距离 D、平方欧式距离在回归分析中若存在较为严重的多重共线性问题,则()。A、 估计过程会中断,无法估计出回归系数B、 各共线变量回归系数的估计值仍然能保留较高的精度C、 回归系数估计值的符号可能会违背经济学常识

D、VIF指标的值比较小,不会超过5对于一个平稳的时间序列,其自相关和偏自相关函数图形如下,则该序列最适合的模型形式是()。自相关函数图A、自相关函数图A、AR(2) B、MA(2) C、AR(3)偏自相关函数图D、ARMA(2,2)指出下面哪一个方程一定是错误的()。A、A、y=500+O.Olx,r=0.75xyB、y=-100+0.9x,r=0.86xyC、C、y=-8+3x,r=-0.95xyD、y=-20-0.5x,r=-0.81xy根据6个变量对20个样本点进行聚类分析的谱系图如下所示,则以下说法正确的是()。A、 分成4个类时,第3号和第8号单独构成1类B、 分成4个类时,第18号单独构成1类C、 这里使用的Ward方法又称类平均法D、 计算样本点之间的距离是采用了Ward法调查了一个企业10名员工上个月的缺勤天数,有3人缺勤0天,2人缺勤2天,4人缺勤3天,1人缺勤4天。则缺勤天数的()。A.中位数为2B、中位数为2.5C、中位数为3D、众数为4对列联表进行分析,以下说法正确的是()。A、 要求行变量是定量变量,列变量是定性变量B、 通过F检验可以判定行变量与列变量是否相互独立C、 各行之和与各列之和相等,且均等于样本数的一半D、 当某些单元格的期望频数小于5时,要使用精确检验的分析结果估计的一个MA(2)模型(不包含常数项)的结果如下表所示,则模型表达式为()。ARIMA模型参数. .估计SEtSig.X-模型_1无转换MA滞后1-0.3810.095-4.010530.001滞后20.2890.0953.1368420.006A、X厂OS8%+0.289兀2 B、迟=0.38%-O.289^C、£=竹-0.381役1+皿9% D、Xt=at+O.381%-O.289%为了估计总体比例p,已经求得其95%的置信区间为(72%,78%),下列说法中错误的是()。A、点估计值为75% B、此次估计的误差范围是3%C、用该方法估计的可靠程度95% D、总体比例落在这个置信区间的概率为95%使用K-S检验来进行正态性检验时,以下说法正确的是( )A、 检验的原假设是样本服从正态分布B、 检验的备择假设是样本服从正态分布C、 检验的原假设是总体服从正态分布D、 检验的备择假设是总体服从正态分布在下列叙述中,错误的是()。A、 可以从公开发表的资料中获取数据B、 统计调查中常用的调查方式主要有抽样调查、普查、统计报表等C、 普查也会存在误差D、 从调查中获得的数据通常比从试验中获得的数据更加可靠美国10家公司在电视广告上的花费如下(单位:百万美元):72,63.1,54.7,54.3,29,26.9,25,23.9,23,20。下列图示法不宜用于描述这些数据的是( )A、茎叶图 B、饼图 C、直方图D、箱线图方差分析判断定性自变量对定量因变量的影响,是通过检验()来实现的。A、各总体的均值是否相等 B、各总体的方差是否相等C、各样本的均值是否相等 D、各样本的方差是否相等

在时间序列构成因素的乘法模型中,季节变动成分是()。A、 与时间序列原始数据计量单位相同的绝对量B、 与时间序列长期趋势计量单位相同的绝对量C、 与时间序列循环变动计量单位相同的绝对量D、 与时间序列循环变动计量单位相同的相对量移动平均的项数越大,其结果会()。A、对原序列数据的修匀作用越大B、使原序列数据的波动更大C、对原序列数据没有影响 D、使原序列数据的逐期增长量更接近常数二、多项选择题(选出表述正确的选项,每题至少有两个选项是正确的。每题2分,少选得1分,错选、多选均不得分,共10分。)关于回归分析中的R2,以下说法正确的有( )。A、可以是负值 B、取值在0-1之间C、 在一元回归中,对R2开方得到的是自变量与因变量之间的相关系数D、 在多元回归中,对R2开方得到的是多个自变量与因变量之间的复相关系数E、 R2的取值会随着模型中自变量个数的增加而越来越接近于1使用同一组样本根据正态分布估计总体均值时,如果将置信度由95%调整为90%,则()。A、A、z将增大a/2C、样本均值保持不变E、置信区间宽度增加B、〈/2将减小D、置信区间宽度减小对x和y两个变量计算相关系数并进行假设检验的结果如下表,则下列说法中正确的有()。相关性xyxPearson相关性1.800**显著性(双侧).006N100100yPearson相关性.800**1显著性(双侧).006N100100**.在.01水平(双侧)上显著相关。A、 对相关系数的假设检验中#值=0.8B、 对相关系数的假设检验中p值=0.006C、 假设检验的结果是拒绝原假设,认为两个变量存在因果关系D、 以y为因变量,x为自变量做回归(包含常数项),贝9方程的判定系数0.64E、 以y为因变量,x为自变量做回归(包含常数项),则方程的判定系数0.8以下关于假设检验的说法中,正确的有()。A、单侧检验中,一般将想要证明的结论放在原假设中B、 单侧检验中,一般将想要证明的结论放在备择假设中C、 假设检验的结论可以100%正确D、 假设检验中可以根据p值或检验统计量与临界值的之间大小关系得出检验结论E、 若p值大于显著性水平,则结论是“接受原假设”下列关于抽样误差的说法,正确的有A、 在其他条件固定时,样本量越大,抽样误差越小B、 在其他条件固定时,总体内部差异越大,抽样误差越大C、 最大允许误差是人为确定的,是调查可以容忍的最大误差水平D、 用估计量的均值表示E、 在样本量一定的情况下,即便使用不同的抽样方法,仍然可以得到相同的抽样误差三、 判断题(正确的打",错误的打X。每题1分,共10分。)两个变量之间的Pearson相关系数为0.1,说明这两个变量不存在任何相关关系。根据乘法模型进行时间序列分解时,若没有季节变动,则各期季节指数应等于100%。计算加权综合指数时,如果计算的是质量指数,应该选择数量指标作为同度量因素。定序变量不能计算中位数。参数用来描述样本的数量特征,而统计量用来描述总体的数量特征。为了保证OLS估计量的优良性质,在多元线性回归分析中需要假设自变量和因变量之间不存在多重共线性。若实际上原假设为真,而根据假设检验的结果拒绝了原假设,这时候犯了第二类错误。在拟合ARMA模型时,如果模型的残差通过了适应性检验,则说明模型是最优的。在对某地区居民的一项民意调查中,先将所有居民分成若干个居民小区,然后从中随机抽取若干个小区,对选中的小区进行全面调查,这是多阶段抽样。关于单因素方差分析,F统计量的样本观测值可能为负值。四、 计算和案例分析题(共60分,答题时请写清题号。)1(.10分)准备用3种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,每组安排10名工人,并指定每组使用其中的一种方法。通过对每组工人生产的产品数量进行方差分析,得到的部分计算结果如下表所示。请回答如下问题:平方和df均方F显著性组间2100.245946组内3836//总变异29///1) 不同组装方法对产品生产数量是否有显著影响?(4分)2) 请补充填写上面方差分析结果表中的所有空格。(6分)2.(10分)有三家生产相同产品的工厂,在过去的一年中,A工厂的市场份额稳定于30%,B工厂为50%,C工厂为20%。为了提高市场份额,C工厂新开发了一种改良产品并且已经投入市场一段时间。在一次调查中,向200个顾客询问每人对三个工厂产品的购买偏好,结果如下表所示。

200名顾客购买偏好的观察频数A工厂产品B工厂产品C工厂产品观察频数489854请回答以下问题:(1) 若要通过假设检验的方法来说明'C工厂的新产品投入市场后,三家工厂的市场份额是否发生了改变”,请你说明应该采用哪种检验方法,并结合本例说明该方法的基本原理。(6分)(2) 使用SPSS对上述数据进行了检验,得到的结果如下表所示,请说明检验的结论是什么。(4分)检验统计量观察频数卡方107.660adf2渐诉显著性.000a.0个单元(.0%)具有小于5的期望频率。单元最小期望频率为40.0。3.(6分)用SPSS检验两个独立样本的均值是否相等,软件的部分输出结果如下Levene检验均值是否相等的t检验FSig.tdfSig.(双侧)假设方差相等0.7310.395-2.013980.047假设方差不相等-1.99488.8630.0491)写出检验中的原假设和备择假设。(2分)(2)写出检验的p值以及检验的结论。(4分)(6分)在一次身体素质调查中,研究者随机调查了某城市100名成年男子的身高,求出他们的平均身高为170.2厘米。如果已知总体标准差为8厘米,请回答如下问题:(1)假定研究者想把抽样误差控制在1.2厘米以内,那么他应该收集多大容量的样本?(4分)(2)在确定必要样本容量时,需要考虑哪些因素?(2分)(12分)一个研究机构采集了某年洛杉矶12个地区的5个社会经济指标:人口总数(XI)、教育程度(X2)、就业数(X3)、服务业人数(X4)、中等房价(X5),希望通过因子分析来评价这些地区的社会经济总体状况。用SPSS进行因子分析,提取的特征值为勺=2.873,九=1.797,九=0.215,九=0.100,九=0.015,另外得到如下表格2345

旋转成份矩阵a 旋转成份矩阵a 成份得分系数矩阵成份12XI-0.1540.649X20.664-0.129X3-0.0660.623X40.5070.185X50.683-0.131成份12XI-0.0910.484X20.392-0.096X3-0.0390.465X40.2990.138X50.403-0.0981)请计算前两个因子的累计贡献率,并说明它们对5个原始变量的代表性。(3分)(2)请写出变量“就业数(EMPLOY)”关于两个因子的函数表达式。(4分)3)请解释第一个因子和第二个因子的含义。(5分)6.(16分)在对某地区25个城市的商品零售情况进行分析的过程中,认为该城市的社会商品零售总额(Y)与城市人口(X])和人均GDP(X2)有关。通过多元线性回归分析,得到相关计算结果如下表所示:系数模型非标准化系数标准系数tSig.B标准误差试用版1(常量)0.4130.3541.1670.256X]25.54316.5380.3391.5450.137X.-37.9545.732-0.238-6.6210.000模型汇:总模型RR方调整R方标准估计的误差10.997a0.960.99156.95885Anova模型平方和df均方FSig.1回归52.824226.4122644.1943E-16残差2.201220.100045455总计55.02524(1) 请写出该回归模型,并解释回归系数的含义。(4分)(2) 请对模型的线性性是否显著进行检验。(4分)(3) 对X]的回归系数的显著性进行检验。(4分)(4) 根据上述分析,请对模型进行综合评价,指出是否需要改进模型,并说明你的理由。(4分)

附:可能用到的公式。Z0.02=51.96置信区间::P(1-P)a2\:nZ2兀(1一置信区间::P(1-P)a2\:nZ2兀(1一兀)n_nnq——o—n1+—oN离差平方和SS自由度df均方MSF值组间SSAr-1MSAMSA/MS

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论