(完整版)统计学题库及题库答案最新(精华版)_第1页
(完整版)统计学题库及题库答案最新(精华版)_第2页
(完整版)统计学题库及题库答案最新(精华版)_第3页
(完整版)统计学题库及题库答案最新(精华版)_第4页
(完整版)统计学题库及题库答案最新(精华版)_第5页
已阅读5页,还剩20页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、题库 1统计学题库及题库答案25一、单项选择题(每题2 分,共 20 分)1、调查时间是指()a、调查资料所属的时间b、进行调查的时间c、调查工作的期限d、调查资料报送的时间2、对某城市工业企业未安装设备进行普查,总体单位是()。a、工业企业全部未安装设备b、企业每一台未安装设备c、每个工业企业的未安装设备d、每一个工业企业3、对比分析不同性质的变量数列之间的变异程度时, 应使用()。a、全距b、平均差c、标准差d、变异系数4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量()a、扩大为原来的 3 倍b、扩大为原来的 2/3 倍c、扩大为原来的 4/9 倍d、扩大为原来的

2、2.25 倍5、某地区组织职工家庭生活抽样调查, 已知职工家庭平均每月每人生活费收入的标准差为12 元, 要求抽样调查的可靠程度为0.9545, 极限误差为 1 元, 在简单重复抽样条件下, 应抽选()。a、 576 户b、144 户c、100 户d、288 户6、当一组数据属于左偏分布时,则() a、平均数、中位数与众数是合而为一的b、众数在左边、平均数在右边c、众数的数值较小,平均数的数值较大d、众数在右边、平均数在左边7、某连续变量数列,其末组组限为500 以上,又知其邻组组中值为480,则末组的组中值为()。a、520b、 510c、 500d、4908、用组中值代表组内变量值的一般水

3、平有一定的假定性,即()a、各组的次数必须相等b、变量值在本组内的分布是均匀的c、组中值能取整数2d、各组必须是封闭组9、 x 1 , x 2 , x n 是来自总体 n (,) 的样本,样本均值x 服从()分布2a、 n (,)b.、n (0,1)c.、n (n, n2 )2n (,)d、n10、测定变量之间相关密切程度的指标是()a、估计标准误b、两个变量的协方差c、相关系数d、两个变量的标准差二、多项选择题(每题2 分,共 10 分)1、抽样推断中,样本容量的多少取决于()。a、总体标准差的大小b、允许误差的大小c、抽样估计的把握程度d、总体参数的大小e、抽样组织形式2、抽样估计中的抽样

4、误差()。a、是不可避免要产生的b、是可能通过改进调查方式来消除的c、是可 以事先计算出来的d、只能在调查结束后才能计算的e、其大小是可能控制的3、在什么条件下,加权算术平均数等于简单算术平均数()。a、各组次数相等b、各组变量值不等c、变量数列为组距数列d、各组次数都为 1e、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有()a、 z 检验法b、t 检验法c、d、f 检验法e、 几何检验法5、指出下列分组哪些是属性分组()2检验法a、 人口按性别分组b、 企业按产值多少分组c、家庭收入水平分组d、在业人员按文化程度分组e、产品按质量等级分组三、填空题(每空2 分,共 20 分)

5、1、统计分组的关键问题是正确选择与划分。2、对某村 6 户居民家庭共 30 人进行调查, 所得的结果是, 人均收入 400 元,其离差平方和为 480,则标准差是,标准差系数是。3、抽样推断的主要内容有和两个方面。4、假设检验中的两类错误分别称为和。5、相关系数 r 的取值范围是到。四、简答题(每题5 分,共 20 分)1、众数、中位数、均值的特点与应用场合是什么?2、什么是假设检验的p 值?如何根据 p 值作出假设检验的结论?3、为什么要计算标准差系数?4、单因素方差分析的步骤是什么?五、计算题(每题10 分,共 30 分)1、某班学生统计学原理考试成绩次数分布如下:要求:根据上表资料,计算

6、相应的的数字,填入表中空格。2、根据有关调查,北京市每天每个家庭上网的时间服从正态分布2n (4,1 )。现从北京市家庭中随机抽取16 户,测得平均每天每户家庭上网时间为4.5 小时。试在 0.05 的显著性水平下判断北京市家庭上网的时间是否有显著提高?( z 0.051.645, z 0.0251.96 )3、从 100 家自选商场销售额资料(x,亿元 )和利润额 (y,亿元 )资料计算得知: n=100, x=10, y=20, x2=1.5, y2=50, xy=3。根据以上数据,求出利润额对销售额的直线回归方程。题库 2一、单项选择题(每题2 分,共 20 分)1、统计学自身的发展,沿

7、着两个不同的方向,形成()a、描述统计学与理论统计学b、理论统计学与推断统计学c、理论统计学与应用统计学d、描述统计学与推断统计学2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的80%的五个大型水泥厂的生产情况进行调查,这种调查方式是()a普查b典型调查c抽样调查d重点调查3、用组中值与次数求坐标点连接而成的统计图是()a直方图b条形图c曲线图d折线图4、离中趋势指标中,最容易受极端值影响的是()a极差b平均差c标准差d标准差系数5、一组数据的偏态系数为1.3,表明该组数据的分布是()a正态分布b平顶分布c左偏分布d右偏分布6、抽样平均误差说明抽样指标与总体指标之间的()a实

8、际误差b平均误差c实际误差的平方d允许误差7、假设检验是检验()的假设是否成立。a样本方差c样本方差b总体指标d样本平均数8、用组中值代表组内变量值的一般水平有一定的假定性,即()a、各组的次数必须相等b、变量值在本组内的分布是均匀的c、组中值能取整数d、各组必须是封闭组9、总体平均数的假设检验方法,在小样本,且方差未知时,通常采用()2a、z 检验法b、t 检验法c、检验法d、f 检验法10、年劳动生产率 x(千元)和工人工资y=10+70x,这意味着年劳动生产率每提高1 千元时,工人工资平均()a、增加 70 元b、减少 70 元c、增加 80 元d、减少 80 元二、多项选择题(每题2

9、分,共 10 分)1、概率抽样调查()a、是一种非全面调查b、 其目的是根据抽样结果推断总体数量特征c、它具有经济性、时效性、准确性和灵活性等特点d、其调查单位是随机抽取的e、抽样推断的结果往往缺乏可靠性2、常用的样本指标有()a样本平均数b样本成数c抽样误差d样本方差e标准差3、在什么条件下,加权算术平均数等于简单算术平均数()。a、各组次数相等b、各组变量值不等c、变量数列为组距数列d、各组次数都为 1 e、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有()2a、 z 检验法b、t 检验法c、d、f 检验法e、 几何检验法5、中位数是()a 由标志值在变量数列中所处的位置决定

10、的b 根据标志值出现的次数决定的c 总体单位水平的平均值d 总体一般水平的代表值e 不受总体中极端数值的影响三、填空题(每空2 分,共 20 分)检验法1、一个完整的统计工作过程可以划分为、四个阶段。2、当变量数列中算术平均数大于众数时,这种变量数列的分布呈分布;反之, 算术平均数小于众数时,变量数列的分布呈分布。3、评价点估计量好坏的标准有、和。4、相关系数,用于反映条件下,两变量相关关系的密切程度和方向的统计指标。四、简答题(每题5 分,共 20 分)1、离中趋势的指标有哪些(至少列出三个),它们之间有何区别?2、影响抽样误差的因素有哪些?3、相关分析和回归分析的联系与区别?4、假设检验一

11、般有哪些步骤?五、计算题(每题10 分,共 30 分)1、某班级分甲、乙两个学习小组,在统计学考试中,甲小组平均成绩75 分,标准差 11.5 ,乙小组成绩资料如表:成绩(分)人数(人)60 以下260-70570-80880-90690 以上4合计25( 1)计算乙小组的平均成绩。( 2)以尽可能精确的方法比较两小组平均成绩的代表性。2、根据历史的统计,某种产品的次品率为2%。如果要求置信水平为95.45%的置信区间,并要求允许误差不超过4%,应抽取多大的样本?(p(2)95.45%)z3、从 100 家自选商场销售额资料(x,亿元 )和利润额 (y,亿元 )资料计算得知: n=100, x

12、=10, y=20, x2=1.5, y2=50, xy=3。根据以上数据,(1) 求出利润额对销售额的直线回归方程;(2) 预测当销售额为0.5 亿元时,利润额在置信度为95.45%的预测区间(已知预测标准误差为 0.05 亿元)。题库 3一、单项选择题(每题2 分,共 20 分)1. 某地进行私营商业企业经营情况调查,则调查对象是()a该地所有商业企业b该地所有私营商业企业c该地每一私营商业企业d该地每一商业企业2.统计分组的关键问题是()a确定分组标志和划分各组界限b确定组距和组数c确定组距和组中值d确定全距和组距3 用组中值与次数求坐标点连接而成的统计图是()a直方图b条形图c曲线图d

13、折线图4.离中趋势指标中,最容易受极端值影响的是()a极差b平均差c标准差d标准差系数5. 所谓大样本是指样本单位数在()及以上。a30 个b50 个c80 个d100 个6. 抽样指标与总体指标之间抽样误差的可能范围是()a抽样平均误差b抽样极限误差c区间估计范围d置信区间7. 原假设为真,我们却拒绝它的概率为()a1bc1d8. 假设检验是检验()的假设是否成立。a样本方差b总体指标c样本方差d样本平均数9. 下面的函数关系是()a 销售人员测验成绩与销售额大小的关系b 圆周的长度决定于它的半径c 家庭的收入和消费的关系d 数学成绩与统计学成绩的关系10. 年劳动生产率 x(千元) 和工人

14、工资 (元)y=30+70x,这意味着年劳动生产率每提高 1 千元时,工人工资平均()a增加 70 元b减少 70 元c增加 100 元d减少 100 元二、多项选择题(每题2 分,共 10 分)1.询问调查法有以下几种()a访问调查b邮寄调查c电话调查d实验法e观察法2.某单位 100 名职工按工资额分为300 以下、 300-400、400-600、 600-800、800 以上等五个组。这一分组()a是等距分组b是异距分组c末组组中值为800d相邻的组限是重叠的e某职工工资 600 元,应计在 600-800 元组内3. 在各种平均数中,不受极端值影响的平均数是()a算术平均数b调和平均

15、数c中位数d几何平均数e众数4. 在 总 体 1000个 单 位 中 , 抽 取 20个 单 位进 行 调 查 , 下 列 各 项 正 确 的 是()a 样本单位数是20 个b 样本个数是 20 个c 一个样本有 20 个单位d 样本容量是 20 个e 是一个小样本5. 下列哪些变量之间的关系为相关关系()a家庭收入与消费支出关系 b圆的面积与它的半径关系 c广告支出与商品销售额关系d单位产品成本与利润关系e在价格固定情况下,销售量与商品销售额关系三、填空题(每空2 分,共 20 分)1、统计学按方法的构成可以分 与。2 、组距式变量数列,根据各组的组距是否相等可以分为 和 。3、直方图是用的

16、宽度和高度来表示频数分布的图形。4、标准差系数是与之比。5、常用的总体指标有、。四、简答题(每题5 分,共 20 分)1、统计调查方案包括有哪几个方面的内容?2、数据的计量尺度分几类?它们之间有什么区别与联系?3、标准差与标准差系数各是什么含义?衡量数据的离散程度时,如何选择?4、必要的抽样数目受哪些因素的影响? 五、计算题(每题10 分,共 30 分)1. 2006 年某月份甲、乙两农贸市场某农产品价格和成交额、成交量资料如下:品种价格(元 / 斤)甲市场成交额(万元)乙市场成交量(万斤)甲1.21.22乙1.42.81丙1.51.51合计5.54试问哪一个市场农产品的平均价格高?并说明理由

17、。2、某食品厂用自动装袋机包装食品,每袋标准重量为 50 克,每隔一定时间抽取包装袋进行检验。现抽取10 袋,测得其重量为(单位:克) ;49.8, 51,50.5, 49.5, 49.2,50.2, 51.2, 50.3,49.7, 50.6若每袋重量服从正态分布,每袋重量是否符合要求。( 0.05, t0.0252.2622 )3、某 10 户家庭样本具有下列收入和食品支出(元/ 天)数据:收入 x20303240455356586574支出 y79811121413151716试求出以最小二乘法计算的回归方程,并预测当x=5 时 y 的值。题库 4一、单项选择题(每题2 分,共 20 分

18、)1、人口普查的调查单位是()。a . 全部人口b.每个人c.全部人口数d.每户家庭;2、将由显著性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占显著性水平的二分之一,这是() 。a.、单侧检验b、双侧检验c、右单侧检验d、左单侧检验3、产品质量的检查应该采用()。a、重点调查的方法;b、典型调查的方法;c、普查的方法;d、抽样检验的方法;4 某组向上累计次数表示 ()a、大于该组上限的次数有多少; b、大于该组下限的次数有多少; c、小于该组上限的次数有多少; d、小于该组下限的次数有多少;5、对正态总体均值进行区间估计时,其它条件不变,置信水平 1 越大,则置信上限与置信下限的

19、差( )a、越大b、越小c、不变d、不确定6、在其它条件不变的情况下, 如果允许抽样平均误差比原来扩大 2 倍,则样本容量 ( )。a.扩大为原来的4 倍b. 扩大为原来的 2 倍c.缩小为原来的二分之一d. 缩小为原来的四分之一7、某年某地区甲乙两类职工的月平均收入分别为 1060 元和 3350 元,标准差分别为 230 元和 680 元 , 则 职 工 月 平 均 收 入 的 离 散 程 度( )a、甲类较大b、乙类较大c、两类相同d、不确定8、所谓显著水平是指 ( )a、原假设为真时将其接受的概率; b、原假设不真时将其舍弃的概率; c、原假设为真时将其舍弃的概率; d、原假设不真时将

20、其接受的概率;9、在一元线性回归方程 y a bx 中, b 表示 ()a、当 x 增加一个单位时,y 增加 a 的数量; b、当 y 增加一个单位时,x 增加 b 的数量; c、当 x 增加一个单位时,y 的平均增加量; d、当 y 增加一个单位时,x 的平均增加量 .10. 在其他条件相同的前提下:不重复抽样误差()a、大于重复抽样误差b、小于重复抽样误差c、等于重复抽样误差d、与重复抽样误差何者更大无法判定二、多项选择题(每题2 分,共 10 分)1. 频率是()a概率b各组次数c非负数d自然数e各组的次数占总体单位数的比重2. 下列的表述正确的有()a. 总体是唯一确定的,样本是随机的

21、b. 总体指标是确定不变的c. 抽样指标是样本量的函数d. 抽样指标也是随机变量e. 抽样指标是确定不变的3. 若一组数据的偏度系数是 -0.25 ,则下列说法正确的有( )a 平均数、中位数与众数是分离的b 众数在左边、平均数在右边c 数据的极端值在右边,数据分配曲线向右延伸d 众数在右边、平均数在左边e 数据的极端值在左边、数据分配曲线向左延伸4. 进行方差分析需要满足的假设条件有()a 每次试验都是独立进行b 各样本都来自正态总体c 各总体的方差相等d 各样本的样本量相等e 各总体分布相互独立5. 人的血压与体重之间存在一定的相关关系,这种相关属于()a 正相关b 单相关c 负相关d 复

22、相关e 完全相关三、填空题(每空2 分,共 20 分)1、统计调查按调查对象包括的范围不同可分为 与。2 、测定峰度系数 3 时,次数分布曲线为 ;为 3 时,为 ; 3 时,为曲线。3、当时,加权算术平均数等于简单算术平均数。4 、 总 体 方 差 越 大 , 抽 样 误 差 就; 总 体 方 差 越 小 , 抽 样 误 差 。5、当变量数列中算术平均数大于众数时,这种变量数列的分布呈 分布; 反之,算术平均数小于众数时,变量数列的分布呈 分布。四、简答题(每题5 分,共 20 分)1、什么是统计学?怎样理解统计学与统计数据的关系?2、如何对任意两个总体平均数的代表性进行比较?3、影响抽样误

23、差的因素有哪些?4、什么是假设检验的p 值?如何根据 p 值来作出假设检验的结论? 五、计算题(每题10 分,共 30 分)1、随机抽查某企业100 名职工,其月工资资料如下表月工资额(百元)职工数(人)要求 :根据表中资料计5 84算职工月工资的平均数、标8 1010准差和离散系数。1012801214314183合计1002、从 500 名初中生中随机抽出100 名测量身高,通过计算得样本身高平均值x 为 1.65 米,样本标准差 s 为 0.073 ,在概率为 95.45%的保证程度下, 对这些初中生的身高作出区间估计。( 2) =0.9545 )3、对 9 位青少年的身高 y 与体重

24、x 进行观测,并已得出以下数据:y13.54,y 222.9788,x472,要求:x 228158,xy803.02以身高为因变量,体重为自变量,建立线性回归方程。题库 5一、单项选择题(每题2 分,共 20 分) 1.统计学的方法分为() a描述统计学与理论统计学b 理论统计学与推断统计学c 理论统计学与应用统计学d 描述统计学与推断统计学2.某蕊片厂为了掌握该厂的产品质量,拟进行一次质量大检查,这种检查应选择()a统计报表b重点调查c全面调查d抽样调查3.下列分组中按品质标志分组的是()a人口按年龄分组b产品按质量优劣分组c企业按固定资产原值分组d乡镇按工业产值分组4. 在分组时,若有某

25、个数据的值正好等于相邻组的下限时,一般应将其归在()a上限所在组b下限所在组c任意一组均可d另设新组5.方差是数据中各变量值与其算术平均的()a离差绝对值的平均数b离差平方的平均数c离差平均数的平方d离差平均数的绝对值6. 一组数据的偏态系数为-1.3,表明该组数据的分布是()a正态分布b平顶分布c左偏分布d右偏分布7. 原假设为假,我们却不拒绝它的概率为()a1bc1d8. 在简单随机重复抽样条件下,若要求抽样误差为原来的1/2,则样本容量 ()a扩大为原来的5 倍b扩大为原来的2 倍c扩大为原来的4 倍d扩大为原来的 2.5 倍9. 假设检验和区间估计之间的关系,下列说法正确的是()a 虽

26、然概念不同,但实质相同b 两者完全没有关系c 互相对应关系d 不能从数量上讨论它们之间的对应关系10. 当相关系数 r=0 时,表明()a现象之间完全相关b相关程度较小c现象之间完全相关d无直线相关关系二、多项选择题(每题2 分,共 10 分)1. 不属于询问调查法有()a访问调查b邮寄调查c电话调查d实验法e观察法2. 非全面调查是指()a普查b全面统计报表c重点调查d典型调查e抽样调查3. 变量数列中频率应满足的条件是()a各组频率大于1b各组频率大于0c各组频率之和等于1d各组频率之和小于1e各组频率之和大于14. 在 500 位同学中,抽取 100 名同学进行调查,下列各项正确的是()

27、a 样本单位数是1000 个b 样本个数是 100 个c 一个样本有 100 个单位d 样本容量是 100 个e 是一个大样本5. 下列哪些变量之间的关系为函数关系()a家庭收入与消费支出关系 b圆的面积与它的半径关系 c广告支出与商品销售额关系d单位产品成本与利润关系e在价格固定情况下,销售量与商品销售额关系三、填空题(每空2 分,共 20 分)1、统计数据大体上可分为 与两种类型。2 、数据的计量尺度由低级到高级可以分为 、 和。3、当满足条件,加权算术平均数等于简单算术平均数。4、参数点估计的方法有与。5、相关系数的取值范围是 。四、简答题(每题5 分,共 20 分)1、简述平均数、众数

28、、中位数三者的特点与应用场合?2、什么是随机原则?在抽样调查中为什么要遵循随机原则?3、什么是离散系数?它的计算有什么意义?4、什么是假设检验的p 值?如何根据 p 值来作出假设检验的结论? 五、计算题(每题10 分,共 30 分)1.根据下表数据,计算10 名工人日加工零件数均值、标准差。按零件数分组人数01021020520303合计102、根据过去大量资料,西安市每天每个家庭看电视的时间服从正态分布n (4,12 )。现从西安市家庭中随机抽取16 户,测得平均每天每户家庭看电视时间为4.5 小时。试在 0.05 的显每周学习时数x4671013学习成绩y4060507090著性水平下判断

29、西安市家庭看电视的时间是否有显著提高?( z0.051.645 ) 3、检查 5 位同学统计学的学习时间与成绩分布如下表:试求出以最小二乘法计算的回归方程,并预测当每周学习时数为8 时,统计学成绩。题库 6一、单项选择题(每题2 分,共 20 分)1、研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于()a、应用统计学b、描述统计学c、推断统计学d、理论统计学2 、 若 各 个 标 志 值 都 扩 大 2倍 , 而 频 数 都 减 少 为 原 来 的 1/3 , 则 平 均 数()a、扩大 2 倍b、减少到 1/3c、不变d、减少到 1/23、在处理快艇的 6 次试验数据中,得

30、到下列最大速度值:27、38、30、37、35、31.则最大艇速的均值的无偏估计值为()a、32.5b、33c、 39.6d、304 、 若 两 个 变 量 的 平 均 水 平 接 近 , 标 准 差 越 大 的 变 量 , 其()a、平均值的代表性越好b、离散程度越大c、稳定性越高d、离散程度越小5、对正态总体均值进行区间估计时,其它条件不变,置信水平1越小,则置信上限与置信下限的差()a、越大b、越小c、不变d、不确定6、 方 差 分 析中 的 原 假 设 是 关 于所 研 究 因 素()a、各水平总体方差是否相等 b、各水平的理论均值是否相等c、同一水平内部数量差异是否相等d、同一水平内

31、部数值相等7、某年某地区甲乙两类职工的月平均收入分别为1060 元和 3350 元,标准差分别为230元 和680元 , 则 职 工 月 平 均 收 入 的 离 散 程 度()a、甲类较大b、乙类较大c、两类相同d、不确定8 、 在 假 设 检 验 中 , 若()h 0 :500,h 1 :500, 则 此 检 验 是a、左侧检验b、右侧检验c、双侧检验d、不知道9、某专家小组成员的年龄分别为29,45,35, 43,45,58,他们年龄的中位数为()a、45b、40c、44d、4310、某次考试学生的考试成绩x 近似服从正态分布,x n78,64,则可认为有 大约95.45%的学生考 试成绩

32、 分布的范 围是()a、(70, 80)b、(70, 86)c、 (62, 94)二、多项选择题(每题2 分,共d10 分)、(70,90)1. 估计量的评价标准是()a无偏性b有效性c一致性d客观性e及时性2. 下列哪些属于全面调查()a普查b全面统计报表c重点调查d典型调查e抽样调查3. 下列关于变量数列中频率的说明不正确的是()a各组频率大于1b各组频率大于0c各组频率之和等于1d各组频率之和小于1e各组频率之和大于14. 总体平均数的假设检验方法通常有()az 检验法bt 检验法c df 检验法e几何检验法2检验法5. 收入与消费存在一定的相关关系,这种相关属于()a 正相关b 单相关

33、c 负相关d 复相关e 完全相关三、填空题(每空2 分,共 20 分)1 、 统 计 词 有 三 种 涵 义 , 即、与 。2 、 加 权 算 术 平 均 数 受 两 个 因 素 的 影 响 , 一 个 是, 一 个 是 。3、在假设检验中,把符合h 0 的总体判为不符合h 0 加以拒绝,这类错误称为 错误;把不符合h 0 的总体当作符合h 0 而接受,这类错误称为 错误;显著性水平是用来控制犯第类错误的概率。4、直线相关系数等于零,说明两变量之间 ;直线相关系数等于-1,说明两变量之间。四、简答题(每题5 分,共 20 分)1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无

34、意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生,请根据你的了解,写出1 个误用统计学方法的例子,并说明应该如何正确应用方法?2、随机抽样的含义与特点?3、什么是标准差系数?在什么场合下计算标准差系数?4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系?五、计算题(每题10 分,共 30 分)1、随机抽查某企业100 名职工,其月工资资料如下表月工资额(百元)职工数(人)要求 :根据表中资料计5 88 101012121414184算职工月工资的平均数、 标10准差和离散系数。8033合计1002、某快餐店对顾客的平均花费进行抽样

35、调查, 随机抽取了 49 名顾客构成一个简单随机样本, 调查结果为:样本平均花费为 12.6 元,标准差为 2.8 元。试以 95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间; ( 2) =0.9545 )3、从某一行业中随机抽取 5 家企业,所得产品产量与生产费用的数据如下:产品产量(台) xi4050507080生产费用(万元)yi130140145150156要求:利用最小二乘法求出估计的回归方程。附 :x58y144.252xi17900i 152iy104361i 15xi yii 142430题库一答案一、选择题(每题 2 分,共 20 分)1.b2.c3.d4.

36、d5.a6.d7a8.b9.d10.c二、多项选择题(每题2 分,共 10 分)1.abce2.ace3.ade4.ab5.ade三、填空题(每空 2 分,共 20 分)1.分组标志、组矩2.4 元、 0.013. 参数估计、假设检验4. 弃真错误、纳伪错误5.-1, 1四、简答题 ( 每题 5 分,共 20 分)1. 答:( 1)众数是一组数据分布的峰值,是一种位置代表值。 其优点是不受极端值影响。其缺点是具有不唯一性。 ( 1 分)( 2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。( 1 分)( 3)均值是就全部数据计算的,它具有优良的数学性质,是实

37、际中应用最广泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。( 1 分)应用场合: 当数据呈对称分布或接近对称分布时,三个代表值相等或接近相等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布, 特别是当偏斜的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比均值好。此外, 均值只适用于定距或定比尺度的数据, 而对于定类和定比尺度的数据则无法计算均值,但却可以计算众数和中位数。(2 分)2. 答:拒绝原假设的最小的显著性水平,被称为观察到的显著性水平(2 分)。p值检验:若 p,不能拒绝h 0; 若p<,拒绝h 0 ( 3 分)。3.3.答:标准差是反映数据分散程

38、度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响,也就是与变量的均值大小有关。(2 分)。因此, 对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位不同对离散程度测度值的影响,而需要计算标准差系数(3 分)。4、答:方差分析的步骤:首先,计算出总离差平方和(sst)、误差项离差平方和 (sse、) 水平项离差平方和(ssa)。sst反映全部数据总的误差程度;sse反映随机误差的大小; ssa反映随机误差和系统误差的大小,三者之间的关系: sst ssa sse。第二,计算 sse的均方 mse,ssa

39、的均方 msa。将 msa 和 mse 进行对比,即得到所需要的f 检验统计量。第三,将统计量的值 f 与给定的显著性水平a 的临界值 fa 进行比较,作出对原假设h0 的决策。五、计算题 ( 每题 10 分,共 30 分)1.解:(全对,给 10 分,错一空扣 1 分)考分人数比率向上累计向下累计人数(人)比率( %)人数(人)比率( %)60 以下25.025.040100.060-70717.5922.53895.070-801127.52050.03177.580-901230.03280.02050.090 以上820.040100.0820.0合计40100.02.解:根据题意:提

40、出假设:h 0: u4, h 1 : u4 (2 分)nxyxy100nx 2(x )2100样本回归方程:检验统计量 zxu0/n4.51/4162 (3 分)由 0.05,查表临界值 zz 0.051.645由于 z2> z =1.645,所以应拒绝 h 0 而接受 h1,即北京市家庭每天上网的时间确有显著提高。(5 分)3.解: 3102021.51022 (4 分)202101y / n2x / ny x20( 4 分)y 2 x (2 分)100100题库二答案一、选择题(每题 2 分,共 20 分)1.c2.d3.d4.a5.d6.b7b8.b9.b10.a二、多项选择题(每

41、题2 分,共 10 分)1.abcd2.abd3.ade4.ab5.ade三、填空题(每空 2 分,共 20 分)1. 统计设计、统计调查、统计整理、统计分析2. 右偏、左偏3. 无偏性、有效性、一致性4. 线性相关四、简答题 ( 每题 5 分,共 20 分)1. 答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数(2 分)。( 1)全距: 计算简单、 但容易受极端数值的影响,不能全面反映所有标志值的差异及分布状况,准确度差( 2 分)。(2)平均差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;缺点 :用绝对值的形式消除各标志值与算术平均数离差的正负值问题,不便于作

42、数学处理和参与统计分析运算(2 分)。( 3)标准差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度;用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学处理和统计分析运算(2 分)。( 4)离散系数:用来对比不同水平的同类现象,特别是不同类现象总体平均数代表性的大小(2 分)。2. 答:总体各单位的差异程度(即标准差的大小),总体各单位的差异程度越大,抽样误差 越大( 4 分);样本单位数的多少,样本单位数越大,抽样误差越小(2 分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小(2 分);抽样组织方式:简单随机抽样的误差最大( 2 分)。3. 答:相

43、关分析,就是用一个指标来表明现象相互依存关系的密切程度。回归分析,就是根据相关关系的具体形态, 选择一个合适的数学模型, 来近似地表达变量间的平均变化关系( 2分)。( 1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时,必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度(4 分)。( 2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互

44、关系的具体 形式, 确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估算和预测提供了一个重要的方法(4 分)。4、答: 基本步骤: 1.提出原假设和备择假设 ( 2 分)2. 确定适当的检验统计量 ( 2 分)3. 规定显著性水平 ,确定临界值 ( 2 分)4. 计算检验统计量的值 (2 分)5. 作出统计决策 ( 2 分)五、计算题 ( 每题 10 分,共 30 分)1. 解:(1) 乙班的平均分数:x乙xf3750f5075 ( 5 分)乙班平均分数的标准差:乙(x9.79x) 2 f f4800509.79乙班平均分数的标准差系数:乙13.05% ( 3 分)75

45、(2) 比较哪个班的平均分数更有代表性:因为 甲9.98112.22% 小于乙9.797513.05%所以甲班的平均分数更有代表性(2 分)。22. 解:已知:p(1p)0.020.98 , p4% 。( 5 分)1 95.45%即 z /22 。2必要的抽样数目: nz / 2p(12pp)220.020.980.04249 (件)( 5 分)3.解: nxyxy1003102022nx 2(x ) 2100 1.5102y / nx / ny x202100122100100样本回归方程:y 2 x (6 分)将有关数据代入回归方程,得:y 2 x20.51(亿元)置信度为 95.45%的

46、利润额的预测区间为:120.05y120.05 ,即 0.9(元) y 1.1(元)(4 分)。题库三答案一、选择题(每题 2 分,共 20 分)1.b2.a3.d4.a5.a6.a7.d8.b9.b10.a二、多项选择题(每题2 分,共 10 分)1.abc2. bde3.ce4.acde5.acd三、填空题(每空 2 分,共 20 分)1. 描述统计学、推断统计学2. 等距式分组、异距式分组3. 矩形4. 标准差、均值5. 总体均值、总体比例、总体方差四、简答题 ( 每题 5 分,共 20 分)1. 答:完整的统计调查方案包括:(1) 确定调查目的,即为什么调查(2 分);(2) 确定调查

47、对象和调查单位,即向谁调查(2 分);(3) 确定调查项目和调查表,即调查什么(2 分);(4) 其他内容,包括调查的时间与组织安排等(4 分)。2. 答:数据的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、 定序尺度、定距尺度和定比尺度。定类尺度, 是最粗略、 计量层次最低的计量尺度,它是按照事物的某种属性对其进行平行的分类或分组。各类别之间是平等的并列关系,无法区分优劣或大小。( 1 分)定序尺度, 它是对事物之间等级差或顺序差别的一种测度。该尺度不仅可以将事物分成 不同的类别, 而且还可以确定这些类别的优劣或顺序。该尺度的计量结果只能比较大小,不能进行加、减、乘、除数学运算

48、。( 1 分)定距尺度, 它不仅能将事物区分为不同类型并进行排序,而且可以准确地指出类别之间的差距是多少。 该尺度的计量结果表现为数值,并可以计算差值,因而,其结果可以进行加减运算。定距尺度没有一个绝对零点,不能进行乘、除运算。( 1 分)定比尺度, 与定距尺度属于同一层次, 其计量的结果也表示为数值。由于有绝对的零点,可以进行加、减、乘、除运算。 ( 1 分)上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递进的。 高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过来。( 1 分)3. 答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变量值本身水平高低的影响, 也就是与变量的均值大小有关。变量值绝对水平越高, 离散程度的测度值自然也就大,绝对水平越低,离散程度的测度值自然也就小;另一方面,它们与原变量值的计量单位相同,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论