统计学题库及题库答案_第1页
统计学题库及题库答案_第2页
统计学题库及题库答案_第3页
已阅读5页,还剩44页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计学题库及题库答案题库 11、调查时间是指(A、调查资料所属的时间C、调查工作的期限一、单项选择题(每题 2 分,共 20分)B 、进行调查的时间D、调查资料报送的时间2、 对某城市工业企业未安装设备进行普查,总体单位是()。A、工业企业全部未安装设备B、企业每一台未安装设备C、每个工业企业的未安装设备D每一个工业企业3、 对比分析不同性质的变量数列之间的变异程度时, 应使用( )。A、全距 B、平均差C、标准差D、变异系数4、 在简单随机重复抽样条件下,若要求允许误差为原来的2/3 ,则样本容量( )A、扩大为原来的3倍B、扩大为原来的2/3倍C扩大为原来的4/9倍D、扩大为原来的倍5、

2、某地区组织职工家庭生活抽样调查, 已知职工家庭平均每月每人生活费收入的 标准差为 12 元,要求抽样调查的可靠程度为 ,极限误差为 1 元,在简单重复抽样条 件下, 应抽选( )。A、 576 户 B 、 144 户 C 、 100 户 D 、 288 户6、当一组数据属于左偏分布时,则()A、平均数、中位数与众数是合而为一的B、众数在左边、平均数在右边C众数的数值较小,平均数的数值较大D众数在右边、平均数在左边7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为 480,则末组的组中值为()。A、520、510、500、4908、用组中值代表组内变量值的一般水平有一定的假定性,即(

3、9、A、B、C、D、X!,X2,A、各组的次数必须相等变量值在本组内的分布是均匀的组中值能取整数各组必须是封闭组,Xn是来自总体N( , 2)的样本,样本均值X服从2N( ,) B.、N(0,1) C.、N(n ,n “) D分布2N(,)nA、估计标准误C相关系数A、总体标准差的大小B允许误差的大小C、抽样估计的把握程度D、总体参数的大小E、抽样组织形式10、测定变量之间相关密切程度的指标是(、两个变量的协方差 、两个变量的标准差二、多项选择题(每题 2分,共10分)1、抽样推断中,样本容量的多少取决于(2、抽样估计中的抽样误差(A、是不可避免要产生的B 、是可能通过改进调查方式来消除的C、

4、是可以事先计算出来的D、只能在调查结束后才能计算的其大小是可能控制的3、在什么条件下,加权算术平均数等于简单算术平均数()A、各组次数相等B、各组变量值不等C、变量数列为组距数列D、各组次数都为1E、各组次数占总次数的比重相等4、总体平均数的假设检验方法通常有()2A、Z检验法B、t检验法C、检验法D、F检验法E、几何检验法5、指出下列分组哪些是属性分组()A、人口按性别分组B、企业按产值多少分组C、家庭收入水平分组D 在业人员按文化程度分组E、 产品按质量等级分组三、填空题(每空2分,共20分)1、统计分组的关键问题是正确选择 与划分。2、对某村6户居民家庭共30人进行调查,所得的结果是,人

5、均收入400元,其离差平方和为480,贝y标准差是 ,标准差系数3、抽样推断的主要内容有 和两个方面。4、 假设检验中的两类错误分别称为 和5、 相关系数r的取值范围是 到o四、简答题(每题 5 分,共 20分)1、众数、中位数、均值的特点与应用场合是什么?2、什么是假设检验的P值?如何根据P值作出假设检验的结论?3、为什么要计算标准差系数?4、单因素方差分析的步骤是什么?五、计算题(每题 10 分,共 30分)1、某班学生统计学原理考试成绩次数分布如下: 要求:根据上表资料,计算相应的的数字,填入表中空格。22、 根据有关调查,北京市每天每个家庭上网的时间服从正态分布N(4,12) 。现从北

6、 京市家庭中随机抽取 16 户,测得平均每天每户家庭上网时间为小时。试在的显着 性水平下判断北京市家庭上网的时间是否有显着提高? ( Z0.05 1.645, Z 0.025 1.96)3、从 100家自选商场销售额资料 (x ,亿元)和利润额 (y ,亿元)资料计算得知: n=100,E X=10, Y=20, X2二,刀Y2=50, XY=3o根据以上数据,求出利润额 对销售额的直线回归方程。题库 2一、单项选择题(每题 2 分,共 20 分)1 、统计学自身的发展,沿着两个不同的方向,形成( )A、描述统计学与理论统计学B、理论统计学与推断统计学C、理论统计学与应用统计学D、描述统计学与

7、推断统计学2、某地区为了掌握地区水泥生产的质量情况,拟对占该地区水泥总产量的 80%的五个大型水泥厂的生产情况进行调查,这种调查方式是(A 普查 B 典型调查 C 抽样调查 D 重点调查3、用组中值与次数求坐标点连接而成的统计图是(A 直方图B 条形图C 曲线图D 折线图4、离中趋势指标中,最容易受极端值影响的是()A 极差 B 平均差C标准差D标准差系数5、一组数据的偏态系数为,表明该组数据的分布是()A正态分布B平顶分布C左偏分布D右偏分布6、抽样平均误差说明抽样指标与总体指标之间的()A 实际误差B 平均误差C 实际误差的平方D 允许误差7、假设检验是检验()的假设是否成立。A 样本方差

8、 B 总体指标C 样本方差 D 样本平均数8、用组中值代表组内变量值的一般水平有一定的假定性,即()A、各组的次数必须相等B、变量值在本组内的分布是均匀的C、组中值能取整数D、各组必须是封闭组9、总体平均数的假设检验方法, 在小样本,且方差未知时, 通常采用( )2A、Z 检验法B、 t 检验法C、 检验法D、 F 检验法10、年劳动生产率 x (千元)和工人工资 y=10+70x,这意味着年劳动生 产率每提高 1 千元时,工人工资平均( )A、增加70元B、减少70元 C 增加80元D、减少80元二、多项选择题(每题 2分,共 10分)1 、概率抽样调查 ()A、是一种非全面调查B、其目的是

9、根据抽样结果推断总体数量特征C、它具有经济性、时效性、准确性和灵活性等特点D、 其调查单位是随机抽取的E 、抽样推断的结果往往缺乏可靠性2、 常用的样本指标有()A 样本平均数B 样本成数C 抽样误差D 样本方差E 标准差3、 在什么条件下,加权算术平均数等于简单算术平均数()。A、各组次数相等B、各组变量值不等C、变量数列为组距数列D、各组次数都为1E、各组次数占总次数的比重相等4、 总体平均数的假设检验方法通常有()2A、Z 检验法B、t 检验法C、检验法D、F 检验法E、几何检验法5、中位数是()A 由标志值在变量数列中所处的位置决定的B 根据标志值出现的次数决定的C总体单位水平的平均值

10、D总体一般水平的代表值E不受总体中极端数值的影响三、填空题(每空2分,共20分)1、 一个完整的统计工作过程可以划分为、四个阶段。2、 当变量数列中算术平均数大于众数时,这种变量数列的分布呈分布;反之,算术平均数小于众数时,变量数列的分布呈分布。3、 评价点估计量好坏的标准有、和o4、 相关系数,用于反映条件下,两变量相关关系的密切程度和方向 的统计指标。四、简答题(每题5分,共20分)1、 离中趋势的指标有哪些(至少列出三个),它们之间有何区别?2、影响抽样误差的因素有哪些?3、相关分析和回归分析的联系与区别?4、假设检验一般有哪些步骤?五、计算题(每题10分,共30分)1、某班级分甲、乙两

11、个学习小组,在统计学考试中,甲小组平均成绩75分,标准差,乙小组成绩资料如表:成绩(分)人数(人)60以下260-70570-80880-90690以上4合计25(1)计算乙小组的平均成绩。(2)以尽可能精确的方法比较两小组平均成绩的代表性。2、 根据历史的统计,某种产品的次品率为2%如果要求置信水平为 勺置信区间, 并要求允许误差不超过4%应抽取多大的样本? ( P(Z 2) 95.45%)3、从100家自选商场销售额资料(x,亿元)和利润额(y,亿元)资料计算得知:n=100,E X=10, Y=20, X2=,E Y2=50, XY=3 根据以上数据,(1)求出利润额对销售额的直线回归方

12、程;(2)预测当销售额为亿兀时,利润额在置信度为%的预测区间(已知预测标准误差为亿元)。题库3一、单项选择题(每题 2分,共20分)1.某地进行私营商业企业经营情况调杳,则调查对象是()A该地所有商业企业B该地所有私营商业企业C 该地每一私营商业企业D 该地每一商业企业2.统计分组的关键问题是()A确定分组标志和划分各组界限B确定组距和组数6.C 确定组距和组中值D 确定全距和组距3 用组中值与次数求坐标点连接而成的统计图是(A 直方图C 曲线图B 条形图D 折线图4. 离中趋势指标中,最容易受极端值影响的是(极差标准差5.所谓大样本是指样本单位数在(30 个B 50 个7.8.9.B 平均差

13、D 标准差系数)及以上。C 80 个D 100 个抽样指标与总体指标之间抽样误差的可能范围是(抽样平均误差区间估计范围原假设为真,我们却拒绝它的概率为(1C 1抽样极限误差置信区间假设检验是检验()的假设是否成立。样本方差样本方差面的函数关系是(总体指标样本平均数销售人员测验成绩与销售额大小的关系 圆周的长度决定于它的半径 家庭的收入和消费的关系D 数学成绩与统计学成绩的关系10.年劳动生产率x(千元)和工人工资(元)y=30+70x,这意味着年劳动生产率每提高 1 千元时,工人工资平均()A 增加 70 元 B 减少 70 元C 增加 100 元 D 减少 100 元二、多项选择题(每题 2

14、分,共 10分)1. 询问调查法有以下几种(C 电话调查 D 实验法 E 观A 访问调查 B 邮寄调查 察法2. 某单位 100名职工按工资额分为 300以下、300-400、400-600、600-800、800 以上等五个组。这一分组()A 是等距分组 B 是异距分组 C 末组组中值为 800D 相邻的组限是重叠的 E 某职工工资 600 元,应计在 600-800 元 组内3. 在各种平均数中,不受极端值影响的平均数是()A 算术平均数B调和平均数C 中位数 D 几何平均数E 众数4. 在总体 1000 个单位中,抽取 20 个单位进行调查,下列各项正确的是()A 样本单位数是 20 个

15、B 样本个数是 20 个C 一个样本有 20 个单位D 样本容量是 20 个E 是一个小样本5. 下列哪些变量之间的关系为相关关系( )A 家庭收入与消费支出关系B 圆的面积与它的半径关系C 广告支出与商品销售额关系D 单位产品成本与利润关系E 在价格固定情况下,销售量与商品销售额关系三、填空题(每空 2 分,共 20分)1、统计学按方法的构成可以分 与 。2、组距式变量数列,根据各组的组距是否相等可以分为 和 。3、直方图是用 的宽度和高度来表示频数分布的图形。4、标准差系数是 与 之比。5 、 常 用 的 总 体 指 标 有 、 、四、简答题(每题 5 分,共 20分)1、统计调查方案包括

16、有哪几个方面的内容?2、数据的计量尺度分几类?它们之间有什么区别与联系?3、标准差与标准差系数各是什么含义?衡量数据的离散程度时,如何选择?4、必要的抽样数目受哪些因素的影响?五、计算题(每题 10 分,共 30 分)1. 2006年某月份甲、乙两农贸市场某农产品价格和成交额、成交量资料如下:品种价格(元/斤)甲市场成交额(万元)乙市场成交量(万斤)甲2乙1丙1合计一4试问哪一个市场农产品的平均价格高?并说明理由。2、某食品厂用自动装袋机包装食品,每袋标准重量为50克,每隔一定时间抽取包装袋进行检验。现抽取10袋,测得其重量为(单位:克);51,?若每袋重量服从正态分布,每袋重量是否符合要求(

17、=,t.0252.2622 )3、某10户家庭样本具有下列收入和食品支出(元 /天)数据:收x入20303240455356586574支出79811121413151716y试求出以最小二乘法计算的回归方程,并预测当x=5时y的值题库4一、单项选择题(每题 2分,共20分)1、.人口普查的调查单位是()。A .全部人口B.每个人C.全部人口数D.每户家庭;2、将由显着性水平所规定的拒绝域平分为两部分,置于概率分布的两边,每边占 显着性水平的二分之一,这是() 。A. 、单侧检验 B 、双侧检验 C 、右单侧检验 D 、左单侧检验3、 产品质量的检查应该采用()。A、重点调查的方法;B、典型调

18、查的方法;C、普查的方法;D、抽样检验的方法;4 某组向上累计次数表示 ()A、大于该组上限的次数有多少;B、大于该组下限的次数有多少;C、小于该组上限的次数有多少;D、小于该组下限的次数有多少;5、 对正态总体均值进行区间估计时,其它条件不变,置信水平1 越大,则置信 上限与置信下限的差( )A 、越大 B 、越小 C 、不变 D 、不确定6、 在其它条件不变的情况下,如果允许抽样平均误差比原来扩大2 倍,则样本容 量( )。A.扩大为原来的4倍 B.扩大为原来的2倍C.缩小为原来的二分之一D.缩小为原来的四分之一7、 某年某地区甲乙两类职工的月平均收入分别为 1060元和 3350 元,标

19、准差分别 为 230 元 和 680 元 , 则 职 工 月 平 均 收 入 的 离 散 程 度A、甲类较大B、乙类较大C、两类相同D、不确定8、所谓显着水平是指 ( )A、原假设为真时将其接受的概率;B、原假设不真时将其舍弃的概率;C、原假设为真时将其舍弃的概率;D、原假设不真时将其接受的概率;9、在一元线性回归方程y a bx中,b表示()A、当 x 增加一个单位时,y 增加 a 的数量;B、当 y 增加一个单位时,x 增加 b 的数量;C、当 x 增加一个单位时,y 的平均增加量;D、当 y 增加一个单位时,x 的平均增加量 .10在其他条件相同的前提下:不重复抽样误差(A、大于重复抽样

20、误差C、等于重复抽样误差判定B、小于重复抽样误差D、与重复抽样误差何者更大无法二、多项选择题(每题2 分,共 10 分)1. 频率是()A 概率B各组次数C非负数 D 自然数 E 各组的次数占总体单位数的比重2. 下列的表述正确的有(A. 总体是唯一确定的,样本是随机的B. 总体指标是确定不变的C. 抽样指标是样本量的函数D. 抽样指标也是随机变量E. 抽样指标是确定不变的3. 若一组数据的偏度系数是,则下列说法正确的有( )A 平均数、中位数与众数是分离的B 众数在左边、平均数在右边C 数据的极端值在右边,数据分配曲线向右延伸D 众数在右边、平均数在左边E 数据的极端值在左边、数据分配曲线向

21、左延伸4. 进行方差分析需要满足的假设条件有( )A 每次试验都是独立进行B 各样本都来自正态总体C 各总体的方差相等D 各样本的样本量相等E 各总体分布相互独立5. 人的血压与体重之间存在一定的相关关系,这种相关属于( )A 正相关B 单相关C 负相关D 复相关E 完全相关三、填空题(每空2分,共20分)1、统计调查按调查对象包括的范围不同可分为与2、 测定峰度系数3时,次数分布曲线为 ;为(3 3时,为曲线。3、 当时,加权算术平均数等于简单算术平均数。4、 总体方差越大,抽样误差就 ;总体方差越小,抽样误差5、当变量数列中算术平均数大于众数时,这种变量数列的分布呈分布;反之,算术平均数小

22、于众数时,变量数列的分布呈分布。四、简答题(每题5分,共20分)1、什么是统计学?怎样理解统计学与统计数据的关系?2、如何对任意两个总体平均数的代表性进行比较?3、影响抽样误差的因素有哪些?4、什么是假设检验的P值?如何根据P值来作出假设检验的结论?五、计算题(每题10分,共30分)1、随机抽查某企业100名职工,其月工资资料如下表月工资额(百元)职工数(人)要求:根据表中资5 84料计算职工月工资的8- 1010平均数、标准差和离散10 1280系数。12- 14314183合计1002、 从500名初中生中随机抽出100名测量身高,通过计算得样本身高平均值X为 米,样本标准差s为,在概率为

23、的保证程度下,对这些初中生的身高作出区间估 计。( 2)=)3、 对9位青少年的身高y与体重x进行观测,并已得出以下数据:y 13.54 y222.9788 x 472JJJx228158xy 803.02J要求:以身高为因变量,体重为自变量,建立线性回归方程。题库5一、单项选择题(每题 2分,共20分)1. 统计学的方法分为()A描述统计学与理论统计学B理论统计学与推断统计学C理论统计学与应用统计学D描述统计学与推断统计学2. 某蕊片厂为了掌握该厂的产品质量,拟进行一次质量大检查,这种检查应选择(A 统计报表 B 重点调查 C 全面调查 D 抽样调查3. 下列分组中按品质标志分组的是( )A

24、 人口按年龄分组B 产品按质量优劣分组C 企业按固定资产原值分组D 乡镇按工业产值分组4. 在分组时,若有某个数据的值正好等于相邻组的下限时,一般应将其 归在( )A 上限所在组B 下限所在组C 任意一组均可D 另设新组5. 方差是数据中各变量值与其算术平均的( )A 离差绝对值的平均数B 离差平方的平均数C 离差平均数的平方D 离差平均数的绝对值6. 一组数据的偏态系数为,表明该组数据的分布是( )A 正态分布B 平顶分布C 左偏分布D 右偏分布7. 原假设为假,我们却不拒绝它的概率为( )A 1 B C 1D8. 在简单随机重复抽样条件下,若要求抽样误差为原来的 1/2 ,则样本容量( )

25、A 扩大为原来的 5 倍B 扩大为原来的 2 倍C 扩大为原来的 4 倍D 扩大为原来的倍9. 假设检验和区间估计之间的关系,下列说法正确的是(A 虽然概念不同,但实质相同B 两者完全没有关系C 互相对应关系D 不能从数量上讨论它们之间的对应关系10. 当相关系数 r=0 时,表明(A 现象之间完全相关B 相关程度较小C 现象之间完全相关D 无直线相关关系二、多项选择题(每题 2分,共 10 分)1. 不属于询问调查法有(A 访问调查B 邮寄调查C 电话调查D 实验法察法2. 非全面调查是指( )A 普查 B 全面统计报表重点调查D 典型调查样调查3. 变量数列中频率应满足的条件是A 各组频率

26、大于 1各组频率大于 0C 各组频率之和等于各组频率之和小于E 各组频率之和大于4. 在 500 位同学中,抽取100 名同学进行调查,下列各项正确的是A 样本单位数是 1000 个B 样本个数是 100 个C 一个样本有 100 个单位D 样本容量是 100 个E 是一个大样本5. 下列哪些变量之间的关系为函数关系( )A 家庭收入与消费支出关系B 圆的面积与它的半径关系C 广告支出与商品销售额关系D 单位产品成本与利润关系E 在价格固定情况下,销售量与商品销售额关系三、填空题(每空 2 分,共 20分)1、统计数据大体上可分为 与 两种类型。2、数据的计量 尺度由低级到高级可以分 为、 和

27、 。3、当满足 条件,加权算术平均数等于简单算术平均 数 。 4 、 参 数 点 估 计 的 方 法 有 与5、相关系数的取值范围是 。四、简答题(每题 5 分,共 20分)1、简述平均数、众数、中位数三者的特点与应用场合?2、什么是随机原则?在抽样调查中为什么要遵循随机原则? 3、什么是离散系数?它的计算有什么意义?4、什么是假设检验的P值?如何根据P值来作出假设检验的结论?五、计算题(每题10分,共30分)1. 根据下表数据,计算10名工人日加工零件数均值、标准差按零件数分组人数01021020520303合计1022、 根据过去大量资料,西安市每天每个家庭看电视的时间服从正态分布N(4)

28、现从西安市家庭中随机抽取 16户,测得平均每天每户家庭看电视时间为小时。试 在的显着性水平下判断西安市家庭看电视的时间是否有显着提高?( Z-05 1.645 )3、检查5位同学统计学的学习时间与成绩分布如下表:每周学习时数x4671013学习成绩4060507090y试求出以最小二乘法计算的回归方程,并预测当每周学习时数为8时,统计学成绩。题库6 一、单项选择题(每题 2分,共20分)1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( )A 、应用统计学、描述统计学、理论统计学2、若各个标志值都扩大2 倍,而频数都减少为原来的1/3 ,则平均数A、扩大 2 倍B、减

29、少到1/3 C 、不变D、减少到1/23、在处理快艇的 6 次试验数据中,得到下列最大速度值:27、 38、 30、37 、35 、 31. 则 最 大 艇 速 的 均 值 的 无偏估计值为A、 3330C、推断统计学4、若 两 个 变 量 的 平 均 水 平 接 近 , 标 准 差 越 大 的 变 量 , 其( )A、平均值的代表性越好B、离散程度越大C、稳定性越高D、离散程度越小5、对正态总体均值进行区间估计时, 其它条件不变, 置信水平 1 越小, 则置信上限与置信下限的差( )A 、越大 B 、越小 C 、不变 D 、不确定6 、 方差 分析 中 的原 假 设 是 关 于所 研 究因

30、素( )A、各水平总体方差是否相等B、各水平的理论均值是否相等C、同一水平内部数量差异是否相等D、同一水平内部数值相等7、某年某地区甲乙两类职工的月平均收入分别为1060 元和 3350 元,标准 差 分 别 为 230 元 和 680 元 ,则职工月平均收入的离散程度A、甲类较大、乙类较大C、两类相同、不确定8、 在 假 设 检验 中 , 若 H0:500,H1: 500 , 则此 检 验 是A、左侧检验、右侧检验C、双侧检验、不知道9、某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为 ()A、 45、 40、 44、 4310、某次考试学生的考试成绩X 近似

31、服从正态分布,XN 78,64 ,则可为有大约生考成绩分的范围是A、(70,80)、 (70 ,86)C、(62,94)、 (70,90)二、多项选择题每题 2分,共 10 分)1. 估计量的评价标准是(A 无偏性 B 有效性 C 一致性D 客观性E 及时性样调查3. 下列关于变量数列中频率的说明不正确的是( )各组频率大于 0各组频率之和小于 1A 各组频率大于 1 BC 各组频率之和等于 1 DE 各组频率之和大于 14. 总体平均数的假设检验方法通常有( )2A Z 检验法B t 检验法 C 检验法D F 检验法E 几何检验法5. 收入与消费存在一定的相关关系,这种相关属于( )A 正相

32、关B 单相关C 负相关D 复相关E 完全相关三、填空题(每空 2 分,共 20分)1、统计词有三种涵义,即与2、加权算术平均数受两个因素的影响,一个是 ,一个是3、在假设检验中,把符合 H 0的总体判为不符合 H0 加以拒绝,这类错误称为错误;把不符合 H0 的总体当作符合 H 0而接受,这类错误称为错误;显着性水平 是用来控制犯第类错误的概率。4、直线相关系数等于零,说明两变量之间 ;直线相关系数等于-1,说明两变量之间 。四、简答题(每题5分,共20分)1、统计学的确对我们的生活的各个方面起着重要的作用,但如果有意或者无意地误用统计学方法,其结论则会带来更大的欺骗性。为了避免这种情况的发生

33、,请根据你的了解,写出1个误用统计学方法的例子,并说明应该如何正确应用方法?2、随机抽样的含义与特点?3、什么是标准差系数?在什么场合下计算标准差系数?4、说明单因素方差分析中,总离差平方和、水平项离差平方和、误差项离差平方和的含义与三者的关系?五、计算题(每题10分,共30分)1、随机抽查某企业100名职工,其月工资资料如下表月工资额(百元)职工数(人)要求:根据表中资5 84料计算职工月工资的8- 1010平均数、标准差和离散10- 1280系数。12- 14314183合计10049名顾客构成一个简2、某快餐店对顾客的平均花费进行抽样调查,随机抽取了%的置信水平估单随机样本,调查结果为:

34、样本平均花费为元,标准差为元。试以计该快餐店顾客的总体平均花费数额的置信区间;( 2)=) 3、从某一行业中随机抽取 5家企业,所得产品产量与生产费用的数据如下:产品产量(台)Xi4050507080生产费用(万 元)yi130140145150156要求:利用最小二乘法求出估计的回归方程。附:x 58y 144.25 2Xi 179005 2yi 1043615X% 42430i 1题库一答案一、选择题(每题2分,共20分)1. B7A二、多项选择题(每题2分,共10 分)三、填空题(每空2分,共20分)1. 分组标志、组矩2. 4 元、3. 参数估计、假设检验4. 弃真错误、纳伪错误5.

35、-1 , 1四、简答题(每题5分,共20分)1. 答:(1)众数是一组数据分布的峰值,是一种位置代表值。其优点是不受极端值影响。其缺点是具有不唯一性。(1分)(2)中位数是一组数据中间位置上的代表值,也是位置代表值,其特点是不受数据极端值的影响。 (1 分)(3)均值是就全部数据计算的,它具有优良的数学性质,是实际中应用最广 泛的集中趋势测度值。其主要缺点是易受数据极端值的影响。 (1 分)应用场合:当数据呈对称分布或接近对称分布时,三个代表值相等或接近相 等,这时应选择均值作为集中趋势的代表值;当数据为偏态分布,特别是当偏斜 的程度较大时,应选择众数或中位数等位置代表值,这时它们的代表性要比

36、均值 好。此外,均值只适用于定距或定比尺度的数据,而对于定类和定比尺度的数据 则无法计算均值,但却可以计算众数和中位数。 (2 分)2. 答:拒绝原假设的最小的显着性水平,被称为观察到的显着性水平(2 分)。p值检验:若p ,不能拒绝Ho;若p,拒绝Ho( 3分)。3.3. 答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原变 量值本身水平高低的影响,也就是与变量的均值大小有关。( 2 分)。因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接 用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位 不同对离散程度测度值的影响,而需要计算标准差系数(

37、 3 分)。4、答:方差分析的步骤:首先,计算出总离差平方和 (SST) 、误差项离差平方和 (SSE)、水平项离差平方和(SSA)。SST反映全部数据总的误差程度; SSE反映随 机误差的大小;SSA反映随机误差和系统误差的大小, 三者之间的关系:SST= SSA+ SSE第二,计算SSE的均方MSE SSA的均方 MSA将MSA和MSE进行对比,即 得到所需要的F检验统计量。第三,将统计量的值 F与给定的显着性水平a的临 界值Fa进行比较,作出对原假设 H0的决策。五、计算题 (每题 1o 分,共 3o 分)1. 解:(全对,给 10分,错一空扣 1分)考分人数比率向上累计向下累计人数(人

38、)比率(%人数(人)比率(%60以下224060-70793870-8011203180-9012322090以上8408合计40分)由=,查表临界值ZZg.051.6452.解:根据题意:提出假设:H 0: u 4, H1(2分) 检 统 量X U。/ ; n4.5 41/ . 16由于Z= 2Z二,所以应拒绝He而接受H,即北京市家庭每天上网的时间确有显着提高。(5 分)3.解:n XY X Y 100 3 10 20X?n X2(100 1.5 1022 (4 分)11Y/n 卩2 X /nY哌空口100 1000 (4 分)样本回归方程:* 2X(2 分)题库二答案一、选择题(每题2分

39、,共 20 分)1. C7B、多项选择题(每题2分,共10 分)三、填空题(每空2分,共20分)1.统计设计、统计调查、统计整理、统计分析2. 右偏、左偏3. 无偏性、有效性、一致性4. 线性相关四、简答题 (每题 5 分,共 20分)1. 答:离中趋势的常用指标包括:全距、平均差、标准差与标准差系数( 2 分)。(1)全距:计算简单、但容易受极端数值的影响,不能全面反映所有标志值的差 异及分布状况,准确度差( 2 分)。(2)平均差:不易受极端数值的影响,能综合 反映全部单位标志值的实际差异程度; 缺点: 用绝对值的形式消除各标志值与算术 平均数离差的正负值问题,不便于作数学处理和参与统计分

40、析运算(2 分)。(3)标准差:不易受极端数值的影响,能综合反映全部单位标志值的实际差异程度; 用平方的方法消除各标志值与算术平均数离差的正负值问题,可方便地用于数学 处理和统计分析运算( 2 分)。( 4)离散系数:用来对比不同水平的同类现象,特 别是不同类现象总体平均数代表性的大小( 2 分)。2. 答:总体各单位的差异程度(即标准差的大小) ,总体各单位的差异程度越大, 抽样误差越大( 4 分);样本单位数的多少,样本单位数越大,抽样误差越小( 2 分);抽样方法:不重复抽样的抽样误差比重复抽样的抽样误差小( 2 分);抽样组 织方式:简单随机抽样的误差最大( 2 分)。3. 答:相关分

41、析,就是用一个指标来表明现象相互依存关系的密切程度。回归分 析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变 量间的平均变化关系( 2 分)。(1)两者有密切的联系。它们不仅有共同的研究对象,而且在具体应用时, 必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式, 而回归分析则需要依靠相关分析来表明现象数量变化的相关程度(4 分)。2)相关分析与回归分析在研究目的和方法上是有明显区别的。相关分析研究变量之间相关的方向和相关的程度。但是相关分析不能指出变量间相互关系的 具体形式,也无法从一个变量的变化来推测另一个变量的变化情况。回归分析则是研究变量之间相互关

42、系的具体形式,确定一个相关的数学方程式,根据这个数学方程式从已知变量推测未知量,从而为估算和预测提供了一个重要的方法(4分)。4、答:基本步骤:1.提出原假设和备择假设 (2分)2. 确定适当的检验统计量 (2分)3. 规定显着性水平a,确定临界值(2分)4. 计算检验统计量的值 (2分)5作出统计决策(2分)五、计算题(每题10分,共30分)1. 解:(1)乙班的平均分数:xf37505075 (5 分)乙班平均分数的标准差:(x x)2ff 5048009.79乙班平均分数的标准差系数:乙縈13-05%(3分)(2)比较哪个班的平均分数更有代表性:因为甲 99 12.22%小于乙 9791

43、3.05%8175所以甲班的平均分数更有代表性(2分)。2. 解:已知:2P(1 P) 0.02 0.98, p 4% 0 (5 分)1 %即 Z /22 o必要的抽样数目:n Z2/2P2 P) 22 O,。98 49 (件) (5 分):0.0423.解:巴n XYX Y 100 3 10 20n X2 ( X)2100 1.5 102样本回归方程:Y 2X (6分) 将有关数据代入回归方程,得: Y 2X 2 0.5 1 (亿元) 置信度为勺利润额的预测区间为:1 2 0.05 Y 1 2 0.05,即(元)Y (元)(4 分)。题库三答案一、选择题(每题2分,共20分)二、多项选择题(

44、每题2分,共10分)2. BDE三、填空题(每空2分,共20分)1. 描述统计学、推断统计学2. 等距式分组、异距式分组3. 矩形4. 标准差、均值5. 总体均值、总体比例、总体方差四、简答题(每题5分,共20分)1. 答:完整的统计调查方案包括:(1)确定调查目的,即为什么调查(2分);(2)确定调查对象和调查单位,即向谁调查(2分);(3)确定调查项目和调查表,即调查什么(2分);(4)其他内容,包括调查的时间与组织安排等(4分)。2. 答:数据的计量尺度由低级到高级、由粗略到精确分为四个层次,即定类尺度、 定序尺度、定距尺度和定比尺度。定类尺度,是最粗略、计量层次最低的计量尺度,它是按照

45、事物的某种属性对其进行平行的分类或分组。各类别之间是平等的并列关系,无法区分优劣或大 小。(1 分)定序尺度,它是对事物之间等级差或顺序差别的一种测度。该尺度不仅可以 将事物分成不同的类别,而且还可以确定这些类别的优劣或顺序。该尺度的计量 结果只能比较大小,不能进行加、减、乘、除数学运算。 (1 分)定距尺度,它不仅能将事物区分为不同类型并进行排序,而且可以准确地指 出类别之间的差距是多少。该尺度的计量结果表现为数值,并可以计算差值,因 而,其结果可以进行加减运算。定距尺度没有一个绝对零点,不能进行乘、除运 算。(1 分)定比尺度,与定距尺度属于同一层次,其计量的结果也表示为数值。由于有 绝对

46、的零点,可以进行加、减、乘、除运算。 ( 1 分)上述四种计量尺度对事物的计量层次是由低级到高级、由粗略到精确逐步递 进的。高层次的计量尺度可以计量低层次计量尺度能够计量的事物,但不能反过 来。(1 分)3. 答:标准差是反映数据分散程度的绝对值,其数值的大小一方面取决于原 变量值本身水平高低的影响,也就是与变量的均值大小有关。变量值绝对水平越 高,离散程度的测度值自然也就大,绝对水平越低,离散程度的测度值自然也就 小;另一方面,它们与原变量值的计量单位相同,采用不同计量单位计量的变量 值,其离散程度的测度值也就不同。 (2 分)标准差系数是标准差与均值的比较,是一个无量纲的相对数,用于反映与

47、比 较数据的离散程度。 (1 分)因此,对于平均水平不同或计量单位不同的不同组别的变量值,是不能直接 用上述离散程度的测度值直接进行比较的。为了消除变量值水平高低和计量单位 不同对离散程度测度值的影响,而需要计算标准差系数。(2分)4、答:必要抽样数目受以下因素影响:(1)总体方差2。其他条件不变的条件下,总体单位的差异程度大,则应多 抽,反之可少抽一些(1分)。(2)允许误差范围 文或p。允许误差增大,意味着推断的精度要求降低,在 其他条件不变的情况下,必要的抽样数目可减少;反之,缩小允许误差,就要增 加必要的抽样数目(1分)。(3)置信度(1-)。在其他条件不变的情况下,要提高推断的置信程

48、度, 就必须增加抽样数目(1分)。(4)抽样方法。相同条件下,采用重复抽样应比不重复抽样多抽一些样本单 位(1分)。(5)抽样组织方式。由于不同抽样组织方式有不同的抽样误差,在误差要求相同的情况下,不同抽样组织方式所必需的抽样数目也不同(1分)。五、计算题(每题10分,共30分)1. 解:1解:品种价格(兀/斤)甲市场乙市场成交额(m成交量(m/x)成交量成交额(xf)甲12乙21丙11合计一44甲市场平均价格x -m5.51.375 (元)(3分)m4x乙市场平均价格x -xf5.31.325 (元)(3分)f4说明:两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价 格高低不

49、同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销 售价格较高的乙产品最多,而乙市场销售价格最低的甲产品最多,因而使得甲市 场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用(4分)。2. 解:根据题意:提出假设:H0:u 50, H1:u 50检验统计量 tx Uo50.2 50 0.9733S/亦 0.65/彳0由=,查表临界值t /2 t.025 2.2622由于t = t /2=,所以不应拒绝H0,即每袋重量符合要求。n xy x y 10 6275 473 1223. 解:b220.195 (4 分)n x2 x 10 24959 473a y bx 1

50、2.20.915 47.32.9765 (4 分)当 x 5时y a bx 2.9756 0.195 5 3.95元(2 分)题库四答案一、选择题(每题2分,共20分)、多项选择题(每题2分,共10 分)2. CDE三、填空题(每空 2 分,共 20 分)1. 定性数据、定量数据2. 定类尺度、定序尺度、定距尺度、定比尺度3. 各组权数相等4. 矩估计法、极大似然估计法5. -1 ,1四、简答题 (每题 5 分,共 20分)1. 答:( 1)众数:不受极端值影响,具有不惟一性,数据分布偏斜程度较大时应 用(1分)。(2)中位数:不受极端值影响,数据分布偏斜程度较大时应用(2 分)。(3)平均数:易受极端值影响,数学性质优良,数据对称分布或接近对称分布时 应用 (2分)。2. 答:随机原则,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论