统计学练习题含作业及非官方答案_第1页
统计学练习题含作业及非官方答案_第2页
统计学练习题含作业及非官方答案_第3页
统计学练习题含作业及非官方答案_第4页
统计学练习题含作业及非官方答案_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、一、单项选择题1. 根据样本计算的用于推断总体特征的概括性度量值称作 (参数)A.参数 B.总体 C.样本 D.统计量2. 只能归于某一类别的 非数字型数据称为(分类数据)A. 分类数据B.顺序数据C.数值型数据D.数值型变量3. 只能归于某一有序类别的非数字型数据称为(顺序数据)A. 分类数据B.顺序数据C.数值型数据D.数值型变量4. 用来描述样本特征的概括性数字度量称为(统计量)A.参数 B.统计量 C.变量D.变量值5. 为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是(整群抽样)A. 简单随机抽样B.系统抽样C.分层抽样D.整群抽样6. 为了调查某校学

2、生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生进行调查,这种调查方法是(分层抽样)A. 简单随机抽样 B.整群抽样C.系统抽样D.分层抽样7. 经验法则表明,当一组数据对称分布时,在平均数加减1 个标准差的范围之内大约有(68%)A. 68%B.95%C.99%D.100%8. 经验法则表明,当一组数据对称分布时,在平均数加减2 个标准差的范围内大约有(95%)A.68%B.95%C.99%D.100%9. 离散系数的主要用途是(比较多组数据的离散程度)A.反映一组数据的离散程度B.反映一组数据的平均水平C.比较多组数据的离散程度D.比较多组数据的平均水平10. 比较两组

3、数据的离散程度 最适合的统计量是(离散系数)A.极差 B.平均差C.标准差D.离散系数11. 峰态通常是与标准正态分布相比较而言的,如果一组数据 服从标准正态分布,则 峰态系数的值(等于0)A.等于0 B.大于0C.小于0 D.等于112. 如果峰态系数k>0,表明该组数据是(尖峰分布)A.尖峰分布 B.扁平分布 C.左偏分布 D.右偏分布13. 某居民小区准备采取一项新的物业管理措施,为此,随机抽取了 100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有 9户,则该组数据的 中位 数是(赞成)A.赞成 B.69 C.中立 D.2214. 某班共有25名学生,期

4、未统计学课程的考试分数分别为68、73、66、76、86、74、61、89、65、90、69、67、76、 62、81、63、68、81、70、73、60、87、75、64、56,那么 该班考试分数的 下四分位数 和上四分位数 分别是(64.5和78.5)A.64.5 和 78.5 B.67.5 和 71.5 C.64.5 和 71.5 D.64.5 和 67.515. 某行业中随机抽取 10家企业,第一季度的利润额 (单位: 万元)分别是:72、63.1、54.7、54.3、29、26.9、25、23.9、23、20,该组数据的中位数为( 27.95)A.28.46B.30.20C.27.9

5、5D.28.1216. 一组数据的 离散系数 为0.4,平均数为20,则标准差为(8)A.80B.0.02C.4D.8n2' (乂 _x)2方差: S2 =; 离散系数: vs =关n -1X17. 根据中心极限定理可知,当样本容量 充分大时,样本均值的抽样分布服从正态分布,其分布的均值为(口2A.卬 B.X C, D. n18. 根据中心极限定理可知,当样本容量 充分大时,样本均_ 2值的抽样分布服从正态分布,其分布的方差为(三一)n_2_ 2A. B. X c。 D.n19. 假设总体服从均匀分布,从此总体中抽取容量为36的样 本,则样本均值的抽样分布(近似正态分布)A.服从非正态

6、分布B.近似正态分布C.服从均匀分布一 .2D.服从 分布20. 总体均值为50,标准差为8,从此总体中随机抽取容量为64的样本,则样本均值的抽样分布的 均值和标准误差分别为 (50, 1)A.50, 8 B.50, 1 C.50, 4D.8, 821. 当正态总体的 方差未知 时,在大样本条件下,估计总体均 值使用的分布是(正态分布)A.正态分布 B.t分布 C.'分布 D.F分布22. 当正态总体的 方差未知 时,在小样本条件下,估计总体均 值使用的分布是(t分布)A.正态分布 B.t分布 C.'分布 D.F分布23. 根据两个匹配的 小样本估计两个 总体均值之差时,使用的

7、 分布是(t分布)A.正态分布 B.t分布 C.'分布 D.F分布24. 估计两个总体 方差比的置信区间时,使用的分布是(F分 布)A.正态分布 B.t分布 C.'分布 D.F分布25. 一种零件的标准长度 5cm,要检验某天生产的零件是否符 合标准要求,建立的原假设和备择假设应为 (H0:v=5, H1: 乒5)A.H0:质5, H1:吁 5 B.H0:音 5, H1:四=5 C.H0:信 5, H1:砂 5 D.H0:谛 5, H1:修 526. 一项研究表明,中学生中吸烟的比例高达 30%,为检验这 一说法是否属实,建立的原假设和备择假设应为(H0:兀=30% , H1:

8、'丰 30%)A.H0:质30% , H1:30% B.H0: " = 30% , H1:"丰 30%C.H0: " > 30%, H1: " < 30% D. H0: " < 30% , H1: " > 30%27. 列联分析是利用列联表来研究(两个分类变量的关系)A.两个分类变量的关系 B.两个数值型变量的关系 C. 个分类变量和一个数值型变量的关系 D.两个数值型变量的 分布 2,28. 设R为列联表的行数,C为列联表的列数,贝U 分布的 自由度为(R-1) >(0-1)A.R B.CC.R

9、 >CD.(R-1) (C-1)29. 方差分析 的主要目的是判断(分类型自变量对数值型因变 量的影响是否显著)A. 各总体是否存在方差B. 各样本数据之间是否有显著差异C. 分类型自变量对数值型因变量的影响是否显著D. 分类型因变量对数值型自变量的影响是否显著30. 组间误差是衡量不同水平下各样本数据之间的误差,它(既包括随机误差,又包括系统误差)A.只包括随机误差 B.只包括系统误差C.既包括随机误差,又包括系统误差D.有时包括随机误差,有时包括系统误差31. 组内误差 是衡量某一水平下样本数据之间的误差, 它(只 包括随机误差)A.只包括随机误差 B.只包括系统误差C.既包括随机误

10、差,又包括系统误差D.有时包括随机误差,有时包括系统误差32. 单因素方差分析是指只涉及(一个分类型自变量)A. 一个分类型自变量B. 一个数值型自变量C.两个分类型自变量D.两个数值型因变量33. 双因素方差分析涉及(两个分类型自变量)A.两个分类型自变量B.两个数值型自变量C.两个分类型因变量D.两个数值型因变量34. 在方差分析中,数据的误差用平方和来表示的, 其中反映 一个样本中各观测值误差大小的平方和称为( 组内平方和) A.组间平方和 B.组内平方和 C.总平方和 D.水平项平方和35. 在方差分析中,数据的误差用平方和来表示的,其中反映 各个样本均值之间误差大小的平方和称为(组间

11、平方和) A.误差项平方和 B.组内平方和 C.组间平方和 D.总平方和36. 如果一个变量的取值完全依赖于另一个变量,各观测点落 在一条直线上,称为两个变量之间为(完全相关关系)A.完全相关关系B.正线性相关关系C.非线性相关关系D.负线性相关关系37. 如果相关系数r = 0,则表明两个变量之间(不存在线性相 关关系)A.相关程度很低B.不存在任何关系C.不存在线性相关关系D.存在非线性相关关系一E38. 在一元线性回归方程中,回归系数'的实际意义是(当x变量1个单位时,y增加的总数量)A. 当x=0时,y的平均变动数量B. 当x变动1个单位时,y的平均变动数量C. 当x变动1个单

12、位时,y增加的总数量D. 当y变动1个单位时,x的平均变动数量39. 对不同年份的产品成本拟合的直线方程为y =28。Tx,回归系数用=-1.75表示(时间每增加A. 时间每增加1个单位,产品成本平均增加1.75个单位B. 时间每增加1个单位,产品成本平均下降1.75个单位C. 产品成本每变动1个单位,平均需要1.75年时间D. 时间每减少1个单位,产品成本平均增加1.75个单位40. 说明回归方程拟合优度的统计量是(判定系数)A.相关系数 B.回归系数C.判定系数D.估计标准误差41. 各实际观测值(yi)与回归值(* )的离差平方和 称为(残 差平方和)A.总变差平方和 B.残差平方和 C

13、.回归平方和 D.判定系数42. 回归平方和占总平方和的比例称为(判定系数)A.相关系数 B.回归系数C.判定系数D.估计标准误差43. 若两个变量存在负线性相关关系,则建立的一元线性回归方程的判定系数R2的取值范围是(0, 1)A.0 , 1B. 1, 0C. 1, 1 D.小于 0 的任意数44. 若变量x与y之间的相关系数r = 0,则下列结论中正确的是(判定系数R2=0 )一,一,一一,? -1A.判定系数R2=1 B.判定系数R2=0 C.回归系数巳一 1D.估计标准误差se= 045. 在多元线性回归方程?=所。*吗x1 +膈中,回?归系数 |表示(其他变重不变的条件下,自变重 x

14、i变动1?个单位时,因变量 y的平均变动额为 )?A. 自变量xi变动1个单位时,因变量 y的平均变动额为iB. 其他变量不变的条件下,自变量 xi变动1个单位时,因变?量y的平均变动额为匕C. 其他变量不变的条件下,自变量 xi变动1个单位时,因变?量y的变动总额为匕?D. 因变量y变动1个单位时,因变量 xi的变动总额为 i46. 设在多元线性回归方程?=队+阿次/ +阿kXk中, 若自变量xi的回归系数 %的取值接近0,这表明(自变量 xi对因变量y的影响不显著)A. 因变量y对自变量xi的影响不显著B. 因变量y对自变量xi的影响显著C. 自变量xi对因变量y的影响不显著D. 自变量x

15、i对因变量y的影响显著47. 指数平滑法适合于预测(A.平稳序列B.非平稳序列节成分的序列48. 移动平均法适合于预测(A.平稳序列B.非平稳序列1个单位,产品成本平均下降1.75个单位)平稳序列)C.有趋势成分的序列D.有季平稳序列)C.有趋势成分的序列 D.有季节成分的序列49. 用最小二乘法拟合直线趋势方程为彳=bo + bit ,若bi为负数,表明该现象随着时间的推移呈现(下降趋势)A.上升趋势 B.下降趋势 C.水平趋势 D.随机波动50. 对某一时间序列拟合的直线趋势方程为* = bo * b1X ,如 果bi的值等于0,则表明该序列(没有趋势)A.没有趋势B.有上升趋势 C.有下

16、降趋势 D,有非线性趋势二、简答题1. 简要区别描述统计与推断统计?答:描述统计研究的是数据收集、处理、汇总、图表描述、 概括与分析等方法。推断统计是研究如何利用样本数据来推 断总体特征的统计方法。2. 一组数据的 分布特征 可以从哪几个方面进行测度?答:数据分布特征一般可从 集中趋势、离散程度、偏态和峰 度几方面来测度。常用的指标有 均值、中位数、众数、极差、 方差、标准差、离散系数、偏态系数和峰度系数。. 2 ,3. 在列联分析中,简述统计量的计算步骤?(1) 从一组样本数据出发,确定变量之间 的数学关系式。(2) 对这些关系式的 可信程度 进行各种统计检验,并从影响某一特定变量的诸多变量

17、中找出哪些变量的影响显著,哪些不显著。(3) 利用所求的关系式,根据一个或几个变量的取值来预 测或控制另一个特定变量的取值,并给出这种预测或控制的可靠程度。9. 回归分析与相关分析的区别?(1) 相关分析 中,变量x变量y处于平等的地位;回归分 析中,变量y称为因变量,处在被解释的地位,变量x称为 自变量,用于预测因变量的变化。(2) 相关分析中所涉及的变量 x和y都是随机变量;回归 分析中,因变量y是随机变量,自变量 x可以是随机变量, 也可以是非随机的确定变量。(3) 相关分析主要是描述两个变量之间线性关系的密切程 度;回归分析不仅可以揭示变量 x对变量y的影响大小,还 可以由回归方程进行

18、预测和控制。10. 简述一元线性关系 的检验步骤?(1) 提出假设(2) 计算检验统计量 F(3) 作出决策4. 简述单因素方差分析的基本步骤?(1) 提出原假设(2) 构造检验的统计量计算各样本的均值计算全部观测值的总均值计算各误差平方和:总平方和(SST)=组间平方和(SSA) +组内平方和(SSE)计算统计量(3) 统计决策(4) 方差分析表(5) 用Excel进行方差分析5. 简述双因素方差分析的基本步骤?(1) 提出假设(2) 构造检验的统计量(3)统计决策6. 简述方差分析的基本思路和原理?(1) 图形描述(2) 误差分解(3) 误差分析2八7. 简述分布、t分布、F分布及正态分布

19、之间的 美系?三、名词解释1. 拉氏价格指数:以现期价格购买一个基期选定的商品组合 的成本相对于以基期价格购买同一组合的成本的比值。2. 帕氏价格指数:以 现期价格 购买一个现期选定 的商品组合 的成本相对于以基期价格购买同一组合的成本的比值。3.集中趋势:指组数据1RJ某一中心值靠拢的程度,它反映了一组数据 中心点的位置所在。4. 置信区间:由样本统计量所构造的 总体参数 的估计区间。5. 置信水平:将构造置信区间的步骤 重复多次,置信区间中 包含总体参数真值 的次数所占的比例。6. 弃真错误:当原假设为 真时拒绝原假设,所犯的就称为 第一类错误,又称弃真错误,即a错误。7.取伪错误:当原假

20、设为 假时没有拒绝 原假设,所犯的就是第二类 错误,又称 取伪错误,即3错误。8.多重共线性:当回归模型中 两个或两个以上 的自变量 彼此相关时,则称回归模型中存在 多重共线性。9. 趋势:是时间序列 在长期内呈现出来的某种持续 上升或持 续下降的变动。10. 线性趋势:指现象随着时间 的推移而呈现出稳定 增长或下 降的线性变化规律。11. 回归方程:描述因变量y的期望值如何依赖于自变量x的 方程方程。12. 最小二乘估计:通过使因变量的 观测值yi与估计值y?之 间的离差平方和 达到最小来估计0o和01的方法。13. 判定系数:回归平方和 占总平方和 的比例。14. 估计标准误差:说明实际值

21、与其估计值之间相对偏离程度 的指标。8. 回归分析主要解决 哪几方面的问题?15.残差:是因变量的观测值yi与根据估计的回归方程求出的预测值?之差。(1)确定该种食品平均重量的95%的置信区间。解:大样本,总体方差未知,用 z统计量X -z = - : N(0,1 ); X =101.4, s=1.829置信区间:1-a =0.95 , Zz = Z0.025 =1.9616. 拟合优度:指回归直线 对观测值的拟合程度。17. 组内误差:来自水平内部 的数据误差。18. 间接误差:间接测量的误差。19. 系统误差:在重复性条件下,对同一被测量进行 无限多次 测量所得结果的 平均值与被测量的真值

22、之差。20. 回归模型:描述因变量y如何依赖于自变量x和误差项£ 的方程。四、计算题4.2随机抽取25个网络用户,得到他们的年龄数据如下:19152925242321382218302019191623272234244120311723X 一 z 2 下 n1.8291.829=101.4-1.96乂,101.4+1.96乂一 I5050=(100.89, 101.91)(2)如果规定食品重量低于100g属于不合格,确定该批食品合格率的95%的置信区间。解:总体比率的估计大样本,总体方差未知,用 z统计量(1) 计算众数、中位数:M 0=19和23; Me=23(2) 根据定义公式

23、计算四分位数:Q=19; Q3 =26.5(3)计算平均数和标准差:X =24; s=£(5 =6.65 n -1(4)计算偏态系数和峰态系数:SK=n M (x X)3(n -1)(n -2)s3=1.0842 2n(n 1)x (x -x) -3p (为-x) (n-1)K= 4=0.773(n -1)(n -2)(n -3)s4(5)对网民年龄的分布特征进行综合分析:样本数据的均值为24岁,但标准差较大,说明网民年龄之间差异较大。从偏态和峰度系数来看,网民年龄呈现右偏尖 峰分布。母包重里(g)包数969829810031001023410210471041064合计507.11

24、某企业生产的袋装食品采用自动打包机包装,每袋标准 重量为l00g。现从某天生产的一批产品中按重复抽样随机抽 取50包进行检查,测得每包重量 (单位:g)如下:已知食品包重量服从正态分布,要求:p fZ=_一 : N(0,1); p= (50-5) /50=0.9置信区间:I P Zt2 jE,P+Z)t2 旧 n'- n1a =0.95 , Za2=Z0.025 =1.96P 1- PP 1- PP " n ,P " n=(0.8168, 0.9832),0.9 1.967.18某居民小区共有居民 500户,小区管理者准备采取一项 新的供水设施,想了解居民是否赞成。

25、采取重复抽样方法随 机抽取了 50户,其中有32户赞成,18户反对。(1) 求总体中赞成新措施的户数比例的置信区间(a =0.05)32已知:n=50, p=0.64,=0.05, z005/2 = 1.96,50总体中赞成该项改革的 户数比例的95%的置信区间为:P(1- p)0.64(1 -0.64)P士z a / =0.64±1.9叫 =0.64±0.13即(0.51,0.77)(2) 如果小区管理者预计赞成的比例能达到80%,要求估 计误差不超过10%。应抽取多少户进行调查( a =0.05) ?0.12=-0.055已知:r =0.80, a =0.05, Z0.

26、05/2=1.96应抽取的样本量为:(z 一/2)"(1-二)1.962 0.80(1-0.80) En = =2 =5 62E27.20顾客到银行办理业务时往往需要等待一段时间,而等待 时间的长短与许多因素有关,比如,银行业务员办理业务的 速度,顾客等待排队的方式等。为此,某银行准备采取两种 排队方式进行试验,第一种排队方式是:所有顾客都进入一 个等待队列;第二种排队方式是:顾客在三个业务窗口处列 队三排等待。为比较哪种排队方式使顾客等待的时间更短,银行各随机抽取 10名顾客,他们在办理业务时所等待的时 间(单位:分钟)如下:方式16.56.66.76.87.17.37.47.77

27、.77.7方式24.25.45.86.26.77.77.78.59.310要求:(1)构建第一种排队方式等待时间标准差的95%置信区间。2解:估计统计量:上方2 n -1a样本标准差:S; =0.2272 22n -1 S 2 I n -1 S 置信区间: _:2 n -11_: 2 n -11 -a =0.95, n=10,(n -1 )= 4.025(9 )=19.02 ,221 _:.2 n -1 = 0.975 9 =2.7(n 1 )S2(n1 )S2& (n-1_ 9 0.2272 9 0.2272-.19.02,2.7=(0.1075, 0.7574)因此,标准差的置信区

28、间为(0.3279, 0.8703)(2)构建第二种排队方式等待时间标准差的95%置信区间。-2 .日 n -1 S 2 解:估计统计量:22 n -1样本标准差S2 =3.318n 1 S 2n1 S2置信区间:一二一二七2 n -1乙.2 n T1口=0.95, n=10,22 n -1 = 0.025 9 =19.02,'(n1)=综75(9)=2.7(n)S2(n1)S2、2,2l2(n 一1)'性2(n -1= 3.318 9x3.318一 19.02 ,2.7=(1.57, 11.06)因此,标准差的置信区间为(1.25, 3.33)(3)根据(1)和(2)的结果,

29、你认为哪种排队方式更好?答:第一种方式好,标准差小!8.4糖厂用自动打包机打包,每包标准重量是100千克。每天开工后需要检验一次打包机工作是否正常。某日开工后测得9包重量(单位:千克)如下: 99.3 98.7 100.5 101.2 98.3 99.7 99.5 102.1 100.5已知包重服从正态分布,试检验该日打包机工作是否正常(a= 0. 05) ?解:H。: 100; Hi :旷 100 经计算得:X = 99.9778; S= 1.21221检验统计量:X 已 _ 99.9778-100 s n 1.21221、一9当a= 0.05,自由度n 1 = 8时,查表得ta/2 = 2

30、。因为t V上2 ,样本统计量落在接受区域,故接受原假设, 拒绝备择假设,说明打包机工作正常。8.10装配一个部件时可以采用不同的方法,所关心的问题是 哪一个方法的效率更高。劳动效率可以用平均装配时间反 映。现从不同的装配方法中各抽取12件产品,记录各自的装配时间(单位:分钟)如下:甲:313429323538343029 323126乙:262428293029322631 293228两总体为正态总体,且方差相同。问两种方法的装配时间有 无显著不同(a= 0. 05) ?解:建立假设H。: 口一 &=0; Hi: mi- &乒0总体正态,小样本抽样,方差未知,方差相等,检验统计量根据样本数据计算,得n1 = 12, n2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论