西南大学网教[9062]《统计学原理》新版作业及参考答案_第1页
西南大学网教[9062]《统计学原理》新版作业及参考答案_第2页
西南大学网教[9062]《统计学原理》新版作业及参考答案_第3页
西南大学网教[9062]《统计学原理》新版作业及参考答案_第4页
西南大学网教[9062]《统计学原理》新版作业及参考答案_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2016年秋 西南大学网教9062统计学原理新版作业及参考答案1、a企业职工的月平均工资为4500元,标准差为80元;b企业的职工工资为3200元,标准差为78元。可以判断,平均工资代表性较高的企业是( a ) 。 a. a 企业 b. b 企业 c. ab两企业 d. 无法判断 2、统计分组中的开口组是指( b ) a. 变量值很大的组 b. 没有上限或下限的组 c. 既有上限又有下限的组 d. 既无下限又无上限的组 3、已知总体各单位标志值,直接将其加总可得到标志总量,再除以总体单位数,这样求出的算术平均数就是( d ) a. 加权算术平均数 b. 几何平均数 c. 动态平均数 d. 简单

2、算术平均数 4、某企业共有职工230人,将职工按月工资水平分为4个组:2000元以下、2000-3000、3000-4000、5000元以上。分类汇总的结果,各组的人数分别是20人、80人、90人、40人,则第二组月工资水平的组中值是( b ) 。 a. 1500 b. 2500 c. 3500 d. 5500 5、若已知a企业职工的月平均工资为4800元,标准差为80元;b企业的职工月平均工资为3500元,标准差为78元。判断哪个企业平均工资代表性较高应该采用的指标是( d ) 。 a. 标准差 b. 月平均工资 c. 极差 d. 标准差系数 6、某企业9个工人的月工资分别为1400、150

3、0、900、900、1700、1500、1500、1500、2300。则日产量的众数为( b ) a. 1400 b. 1500 c. 2300 d. 1700 7、5.下面哪个指标是总量指标( d )。 a. 居民消费价格指数 b. 人均收入 c. 资金利润率 d. 零售商品总额 8、某企业单位产品成本计划比去年降低5%,实际降低3%,则计划完成相对指标的计算方法为( c ) 。 a. 3%/5% b. 103%/105% c. 97%/95% d. 95%/97% 9、常用的相对指标有:计划完成数、动态相对数、比例相对数、结构相对数、强度相对数,还有( c ) a. 算术平均数 b. 几何

4、平均数 c. 比较相对数 d. 中位数 10、可以作为加权算术平均数权数的有( bc )。 a. 频数分布(分布数列)的组中值 b. 频数分布(分布数列)中各组次数占总次数的比重 c. 频数分布(分布数列)各组的次数 d. 频数分布(分布数列)各组的上限 11、常用的位置平均数是( cd )。 a. 算术平均数 b. 几何平均数 c. 中位数 d. 众数 12、容易受极端值的影响平均指标是( bc ) 。 a. 中位数 b. 算术平均数 c. 几何平均数 d. 众数 13、不能用标准差直接比较两个总体标志变异程度的原因是 ( acd ) a. 总体的水平不同 b. 总体单位个数不同 c. 总体

5、的性质不同 d. 标志值的计量单位不同 14、常用的变异指标有( abcd ) a. 极差 b. 标准差 c. 变异系数 d. 平均差 15、下列关系中,为负相关的现象有( bcd ) 。 a. 产品产量与耗电量 b. 产品产量与单位产品成本 c. 商品价格与销售量 d. 居民收入水平与居民食品消费比重 e. 个人受教育程度与收入水平 16、抽样调查( abcd )。 a. 是一种非全面调查 b. 其目的是根据抽样结果推断总体数量特征 c. 它具有经济性、时效性和准确性等特点 d. 其调查单位是随机抽取的 e. 抽样推断的结果往往缺乏可靠性 17、总指数的作用表现在以下几个方面( acd )

6、。 a. 综合反映现象总体的变动方向和变动程度 b. 现象总体的内部结构 c. 分析现象总体变动中各个因素的影响方向和影响程度 d. 分析研究现象在较长时间内的发展变化趋势 18、时间数列的分析指标有( abd )。 a. 发展水平与平均发展水平 b. 增长量与平均增长量 c. 相关系数 d. 发展速度与平均发展速度 e. 标准偏差 19、频数分布由两部分构成,即( ab ) 。 a. 按某标志分组形成的组别 b. 与各组相对应的总体单位数(频数) c. 总体各单位的名称 d. 各组之间的联系方式 20、在审核统计资料的准确性时,采用的方法主要是( cd ) a. 分类法审核法 b. 分组法审

7、核法 c. 逻辑检查 d. 计算检查 21、调查方案的基本内容有( abcde ) a. 确定调查内容(项目) b. 确定调查对象和调查单位 c. 确定调查目的 d. 确定调查时间和期限 e. 确定调查费用、人员培训组织等 22、按取得的方式不同,统计数据的来源有( ae )。 a. 直接来源 b. 从互联网查找 c. 统计调查 d. 从公开出版物中查找 e. 间接来源 23、统计研究的具体方法有( abce ) a. 大量观察法 b. 统计推断法 c. 统计分组法 d. 动态分析法 e. 综合指标法 24、统计指标由两个基本的要素组成,即( ae )。 a. 指标的名称 b. 指标的性质 c

8、. 指标的作用 d. 指标的属性 e. 指标的具体数值 25、调查问卷中的封闭式问题( ade ) a. 是指提出了问题又给出了备选答案的问题 b. 是指提出了问题但没有给出备选答案的问题 c. 是调查者可自由回答的问题 d. 是调查者只能在备选答案中选择答案的问题 e. 应多于开放式问题 26、统计搜集原始资料的具体方法有( ace ). a. 询问法 b. 问卷调查法 c. 实验法 d. 观察法 e. 连续法 27、统计总体必须具备的条件有( abc ) a. 大量性 b. 差异性 c. 同质性 d. 总体性 e. 数量性 28、计算总指数的方法有( ac ) 。 a. 平均指数法 b.

9、回归分析法 c. 综合指数法 d. 简单平均法 29、时间数列是将某一指标数值按时间先后顺序加以排列所形成的统计数列,它由两个要素组成,即( ab ) a. 指标所属的时间 b. 指标的数值 c. 指标的计算方法 d. 指标的性质 30、不受极端值影响的平均指标有( bc ) 。 a. 算术平均数 b. 中位数 c. 众数 d. 几何平均数 31、不能用标准差直接比较两个总体标志变异程度的原因是( abd ) 。 a. 总体标志值的水平不同 b. 总体标志值的性质不同 c. 总体标志值的个数不同 d. 总体标志值的分类方法不同 32、常用的变异指标有( abcd ) a. 极差 b. 中位数

10、c. 平均差 d. 标准差 e. 变异系数 33、容易受极端值的影响平均指标是( ad ) 。 a. 几何平均数 b. 中位数 c. 众数 d. 算术平均数 34、常用的位置平均数是( bc ) a. 算术平均数 b. 中位数 c. 众数 d. 几何平均数 35、常用的数值平均数有( ad ) a. 算术平均数 b. 中位数 c. 众数 d. 几何平均数 36、从形式上看,统计表由以下要素构成( bcde ). a. 主词 b. 总标题 c. 统计数据 d. 横行标题 e. 纵栏标题 37、一般来说,“统计”一词的含义有( acd ) 。 a. 统计工作 b. 统计机构 c. 统计学 d. 统

11、计资料 38、为什么要对回归模型进行检验? 我们建立回归模型,首先要通过定性分析,确定那些对被解释变量有直接影响的变量作为解释变量,并结合散点图,对这种影响是否线性作出判断,如果不是线性影响,进而分析是哪种非线性影响,初步确定解释变量对被解释变量的影响关系式,然后根据统计数据,对关系式中的参数作出估计,得出回归模型。然而,数据是否支持定性分析结果,具体地说统计数据能否证实解释变量对被解释变量的影响关系式正确,解释变量是否显著是需要进行统计检验的;当解释变量对被解释变量的影响关系式正确时,误差项的设定与实际情况不同,解释变量之间存在多重共线性,都会导致参数估计误差大,因此也需要检验。39、简述相

12、关分析和回归分析的关系 相关分析不必区分自变量(解释变量)和因变量(被解释变量),变量之间是平行关系,而回归分析要根据研究目的确定自变量和因变量,变量之间是因果关系;相关分析中两个变量都是随机的,而回归分析中,因变量是随机变量,而自变量是非随机的;回归分析可以得到变量之间关系的方向、强弱程度和具体数量变动关系,而相关分析只能确定变量之间关系的方向和程度。回归分析是在相关分析的基础之上,进一步研究现象之间的数量变化规律; 40、回归模型中随机误差项的意义是什么? 为随机误差项,正是由于随机误差项的引入,才将变量间的关系描述为一个随机方程,使得我们可以借助随机数学方法研究y与x1,x2.xp的关系

13、,由于客观经济现象是错综复杂的,一种经济现象很难用有限个因素来准确说明,随机误差项可以概括表示由于人们的认识以及其他客观原因的局限而没有考虑的种种偶然因素。 41、简述抽样估计的优良标准?(1)无偏性:指样本指标的平均数等于被估计的总体指标。(2)有效性:用样本指标估计总体指标时,若某样本指标的方差比其他估计量的方差小,则称该样本指标是总体指标的最有效的估计量。(3)一致性:以样本指标估计总体指标,要求当样本单位数相当大时,样本指标充分靠近总体指标,则称这个估计量为一致的估计量。 42、一个完整的统计调查方案应包括哪些主要内容? 一个完整的统计调查方案包括以下主要内容: (1) 确定调查目的。

14、 (2) 确定调查对象和调查单位。 (3) 确定调查项目, 拟定调查表。 (4) 确定调查时间和时限。 (5) 确定调查的组织和实施计划。43、统计数据收集过程中,可能有哪些误差? 统计数据收集过程中,可能存在两种误差:观测性误差和代表性误差。观测性误差(登记性误差或调查性误差),是在调查观测的各个环节因工作粗心,或被观测者不愿很好配合而造成的所收集数据与实际情况不符的误差。观测性误差在全面调查和非全面调查中都会产生。 代表性误差是在抽样调查中,由于样本不能完全代表总体而产生的估计结果与总体真实数量特征不符的误差。代表性误差又分为系统性代表性误差 和偶然性代表性误差,系统性代表性误差是指由于抽

15、样框不完善,抽样违反随机原则,被调查者无回答等因素引起的误差;系统性代表性误差通常难以计算和控制。偶然性代表性误差是由于抽样的随机性引起的样本结构与总体结构不完全相符,从而产生的估计结果与总体真值不一致的误差;偶然性代表性误差不可避免,但是可以计算和控制。抽样调查中的观测性误差和系统性代表性误差统称为非抽样误差,而偶然性代表性误差称为抽样误差。44、算术平均数、中位数和众数三者的数量关系说明什么样的变量分布特征?中位数、算术平均数、众数三者完全相等时,变量分布完全对称(正态分布);中位数、算术平均数、众数三者存在差异时,变量分布不对称;在轻微偏态时,众数与算术平均数的距离约等于中位数与算术平均

16、数距离的3倍。45、为什么强调运用回归分析研究经济问题要定性分析和定量分析相结合?在回归模型的运用中,我们还强调定性分析和定量分析相结合。这是因为数理统计方法只是从事物外在的数量表面上去研究问题,不涉及事物质的规定性,单纯的表面上的数量关系是否反映事物的本质?这本质究竟如何?必须依靠专门的学科研究才能下定论,所以,在经济问题的研究中,我们不能仅凭样本数据估计的结果就不加分析地说长道短,必须把参数估计的结果和具体经济问题以及现实情况紧密结合,这样才能保证回归模型在经济问题研究中的正确应用。46、变量间统计关系和函数关系的区别是什么变量间的统计关系是指变量间具有密切关联而又不能由某一个或某一些变量

17、唯一确定另外一个变量的关系,而变量间的函数关系是指由一个变量唯一确定另外一个变量的确定关系。47、序时平均数与静态平均数有何异同?相同点: 均能消除数量上的差异,反映一般水平。 不同点: 动态平均数是统一现象不同时间上指标数值的平均,消除的是该现象在不用时间上的数 量差异;综合说明现象在一段时间的一般水平。 静态平均数是同一时间上总体各单位数值的平均,消除的是总体各单位的数量差异;综合说明总体各单位的一般水平。48、如何理解统计分组的含义与性质含义:根据统计研究的目的和事物本身的特点,选择一定的标志,将研究现象总体划分为若干个不同的组和类的一种统计研究方法。 性质: 1)统计分组有分和合的双重

18、功能,是分与合的对立统一。 2)统计分组必须遵守“穷尽原则”和“互斥原则”,即现象总体中任何一个个体都必须而且只能属于某一个组,不能遗漏或重复。 3)统计分组的目的是要在同质性的基础上研究总体的内在差异性,即先出份额组标志的组间差异而缩小组内差异。 4)统计分组在体现分组标志的组间差异的同时,可能压盖了其他标志的组间差异,因此,任何统计分组的意义都有一定的限定性。 5)统计分组的关键是分组标志的选择和分组界限的确定,如果分组标志选择不当或分组界限不合理, 就会混淆事物的性质,难以反映现象总体的特征。 49、统计的含义与本质是什么(1)“统计”一词可以有三种含义:统计活动、统计数据、统计学统计活

19、动是对各种统计数据进行收集、整理并做出相应的推断、分析的活动,通常被划分为统计调查、统计整理、和统计分析三个阶段;统计数据是通过统计活动获得的,用以表现研究现象特征的各种形式的数据;统计学则是指导统计活动的理论和方法,是关于如何收集、整理和分析数据的科学。(2)统计的本质是关于为何统计,统计什么,和如何统计的思想。50、环比发展速度和定基发展速度之间有什么关系?(1)区别:环比发展速度是各期水平与前一期水平的对比,表明报告期水平对比前一期水平的逐期发展变动的情况。定基发展速度是报告期水平与某一固定期水平的对比,说明现象在一较长时间内的变动程度,因此又叫某一时间内的发展总速度。(2)联系:环比发

20、展速度的连乘积等于相应的定基发展速度。51、某市调查400户居民家庭收入资料如下表:人均月收入(元) 组中值 家庭户数 月收入100200 150 40 6000200300 250 120 30000300400 350 140 49000400500 450 80 36000500600 550 20 11000合计 - 400 132000 试求全距,平均值解:全距=600-100=500(元)平均值=132000/400=330(元)52、六、某加油站经理希望了解驾车人士在该加油站的加油习惯。在一周内,他随机地抽取100名驾车人士调查,得到如下结果:平均加油量等于13.5加仑,样本标准

21、差是3.2加仑,有19人购买无铅汽油。试问:(1)以0.05的显著性水平来说,是否有证据说明少于20%的驾车者购买无铅汽油?(2)计算(1)的p-值。解:(1)(1)假设检验为。采用成数检验统计量。查出0.05水平下的临界值为1.64和1.65之间。计算统计量值,因此z2.5-1.65(-1.64),所以拒绝原假设。p值为0.00062(因为本题为单侧检验,p值(1-f(|z|)/2 )。显然p值1.96,所以拒绝原假设。对应p值2(1-f(z) ,查表得到f(z)在0.999 994和0.999 999之间,所以p值在0.000 006和0.000 001之间(因为表中给出了双侧检验的接受域

22、概率,因此本题中双侧检验的p值1-f(|z|),直接查表即得f(|z|))。p值2.34(2.32),所以拒绝原假设,无故障时间有显著增加。55、对某地区120家企业按利润额进行分组,结果如表所示。按利润额分组(万元) 企业数(个) 向上累计200300 19 19300400 30 49400500 42 91500600 18 109600以上 11 120合计 120计算120家企业利润的众数、中位数和均值;解:(1)众数:因为这120家企业中有42家企业的利润都在400-500万元,出现的次数最多。l=400,u=500, f表示众数所在组次数=42, f-1表示众数所在组前一组的次数

23、=30, f+1表示众数所在组后一组的次数=18,代入上限公式,得众数:=500-(42-18)/(42-18)+(42-30) (500-400)=433.33万元(2)中位数的位置=(n+1)/2=60.5,位于400-500万元组me中位数;l中位数所在组下限=400;u中位数所在组上限=500;fm为中位数所在组的次数=42;f总次数=120;d中位数所在组的组距(u-l);sm 1中位数所在组以下的累计次数=49;sm+ 1中位数所在组以上的累计次数=29。代入下限公式,得中位数:=400+(120/2-49)/42 (500-400)=426.19 万元。(3)5个利润额组的组中值

24、分别为:(200+300)/2=250,(300+400)/2=350,(400+500)/2=450,(500+600)/2=550,600+100/2=650均值=(19250+30350+42450+18550+11650)/120=426.67万元 56、某汽油站有两种商标的汽油a和b,某天售出的50桶汽油可按商标a和b排成这样的顺序:aabaababbaaabbabbabbabbabaabbbbaabababaaabaaaaabb试问:在显著性水平a=0.05条件下,这一序列是否有随机性?解: 因为a (8个),aa(4个),aaa(2个),aaaaa(1个),b(7个),bb(6个

25、),bbbb(1个)。n1=27,n2=23。假设检验h0:样本为随机样本,h1:样本为非随机样本。求出游程总和。r1=15,r2=14,r=29。因为,构造统计量。由于=0.05的临界值为1.96, z=0.909-1.64,所以接受原假设。p值为0.48和0.476之间(因为本题为单侧检验,p值(1-f(|z|)/2 )。显然p值0.05,所以接受原假设,抽样没有表明报纸订阅率显著下降。58、某市调查400户居民家庭收入资料如下表:人均月收入(元) 组中值 家庭户数 月收入100200 150 40 6000200300 250 120 30000300400 350 140 490004

26、00500 450 80 36000500600 550 20 11000合计 - 400 132000试求标准差,标准差系数解:标准差=【(150-330)平方40+(250-330)平方120+(350-330)平方140+(450-330)平方80+(550-330)平方20】/400开平方=102.96(元)标准差系数=102.96/330=0.31259、对某地区120家企业按利润额进行分组,结果如表所示。按利润额分组(万元) 企业数(个) 向上累计200300 19 19300400 30 49400500 42 91500600 18 109600以上 11 120合计 120计

27、算分布的偏态系数和峰度系数。解:先计算120名家企业利润额的标准差=【(250-426.67)平方19+(350-426.67)平方30+(450-426.67)平方42+(550-426.67)平方18+(650-426.67)平方11】/120开平方=116(1)分布的偏态系数=【(250-426.67)立方19+(350-426.67)立方30+(450-426.67)立方42+(550-426.67)立方18+(650-426.67)立方11】/120116立方=0.206(2)分布的峰度系数=【(250-426.67)4次方19+(350-426.67)4次方30+(450-426.

28、67)4次方42+(550-426.67)4次方18+(650-426.67)4次方11】/120116 4次方=2.35 60、 计算分析题(要写出主要的计算步骤,否则不得分。)1.从一群成年人和一群幼儿中各随机抽取10名,对他们的身高(cm)进行调查,这10名儿童的身高分别是(cm):68、69、68、72、71、78、72、72、74、80。要求:(1)确定这组儿童身高的中位数和众数;(2)计算这组儿童身高的算术平均数;(3)计算这组儿童身高的标准差;(4)若成年组的平均身高为174cm,标准差为3.87cm。请计算恰当的指标,并比较分析哪一组人群的身高差异大。 解:(1)中位数:首先将

29、这10名儿童的身高由低到高排序:68、68、69、71、72、72、72、74、78、80;其次求中间位置,为(10+1)/2=5.5位;由于第五和第六中间位中间位置,所以将第五位和第六位的身高值平均即为中位数 :(72+72)/2=72cm。众数:因为这10名儿童中有3位的身高都是72cm,出现的次数最多,所以儿童身高的众数是72cm。(2)这组儿童身高的算术平均数 =(68+69+68+72+71+78+72+72+74+80)/10=72.4cm。(3)这组儿童身高的标准差 =(68-72.4)平方+(69-72.4)平方+(68-72.4)平方+(72-72.4)平方+(71-72.4

30、)平方+(78-72.4)平方+(72-72.4)平方+(72-72.4)平方+(74-72.4)平方+(80-72.4)平方/10开方=3.80cm。(4)由于成年组和儿童组的平均身高不同,因此应该用标准差系数比较身高的差异程度。成年组的身高标准差系数=3.87/174=2.2%儿童组的身高标准差系数=3.80/72.9=5.2%由于儿童组身高的标准差系数较高,所以身高差异比成年组大。2.某市随机抽取100名职工,对其月收入进行了调查,经整理资料如下:月收入(元) 人数(人)2000以下 182000-3000 623000-5000 20合计 100根据以上资料,要求:(1) 计算各组月收入的组中值;(2) 确定100名职工月收入的算术平均数;(3)计算1

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论