




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第13章复习题1. 1. 简答题(1) 什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集,整理和分析统计数据的方法论科学,其目的是探索数据内在的规律性,已达到对客观事物的科学认识。统计学和统计数据之间有着密不可分的关系。统计学是由一套收集和处理统计数据的方法所组成,这些方法来源于对统计数据的研究,目的也在于对统计数据的研究。统计数据不用统计方法去分析也仅仅是一堆数据而已,无法得出任何有益的结论。(2) 简述统计调查方案的基本内容答:调查方案是调查工作的计划性文件,是对整个调查工作的事先安排。调查内容不同,调查方案有一
2、定的差异,但一般都包括以下几个方面的内容:即调查目的、调查对象和调查单位、调查内容(调查项目)、调查方式与方法、调查工作的组织与实施计划等。(3) 最常用的统计调查方式是什么?他有什么特点?答:统计调查方式是指搜集数据时所采用的组织形式。在实际中应用最 广泛的调查方式是抽样调查。抽样调查是从调查对象中随机抽取一部分单位 作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种非全面 调查方法。与其它调查方式相比,抽样调查具有经济性、时效性强、适应面广、准确性高等特点。(4) 最常用的搜集统计资料的方法是什么?答:搜集统计资料的方法是指搜集数据所采用的具体办法,其主要有访问 法、观察法和实验
3、法,其中访问法最为常用。(5)简述组距式分组的步骤。答:第一步,确定全距,以了解数据的变动范围,为确定组距提供依据; 第二步,确定组数,确定组数的基本原则是确保组内的同质性、组间的差异性,同时能反映数据的分布特征,具体可参考经验公式确定; 第三步,确定组距,等组距时,组距=全局/组数; 第四步,确定组限,注意组限的表示方式;第五步,分组并编制次数分布表,会制次数分布图。2. 2. 填空题(1)一个完整的统计工作过程,包括 统计设计、 统计调查、 统计整理、 统计分析 和统计资料的管理与提供。(2)统计一词有三种含义,即 统计工作 、
4、统计资料 、 统计学 。 (3)从统计方法的构成来看,统计学可分为 描述统计 、 推断统计 ;从统计方法的研究和应用来看,可分为 理论统计 、 应用统计 。 (4)在统计中,把 说明现象某种特征的概念 称为变量,变量的具体表现称为 变量值 。 (5)从统计数据本身的来源看,统计数据最初都来源于 直接的调查或试验 。 (6)就一般的统计数据而言,可将其质量评价标准概括为六个方面: 精度 、 准确度 、 关联性 、 及时性 、 一致性 、 最低成本 。 (7)在数据整理过程中,对品质数据主要是做 分类 整理,对数值型数据主要是做 分组 整理。 3、3.
5、; 选择题单选题:(1)文化程度这一品质变量,所采用的计量尺度为:( )定类尺度 定序尺度 定距尺度 定比尺度(2)统计数据就是( )统计变量值 统计指标 统计变量 统计标志(3)某地区对占该地区工业总产值三分之二的6个企业进行调查,这一调查方式是( )抽样调查 重点调查 普查 典型调查(4)一个等距数列,末组为开口组,已知其下限为400,该组组中值为425,则该数列中各组的组距为( ) 25 50 100 12.5(5)按连续性变量分组,其末组为开口组,下限为200,相邻组的组中值为1750,则末组中值为( ) 2500 2250 2100 2200(6)有20个工人
6、看管机器台数资料为2,5,4,4,3,4,3,4,4,2,2,4,3,4,6,3,4,5,2,4,对以上资料分组应采用( ) 单变量值分组 等距式分组 不等组距式分组 以上分组均可(7)企业按业务收入计划完成程度分组,第一组为以下,第二组为,第三组为1,第四组为以上,则其计划完成程度为() 在第一组 在第二组 在第三组 120% 在第三组(8)下列不适合定序数据的图形是( )条形图 圆形图 环形图 直方图(9)某地区人口的男女性别比为105100,这一对比关系是( )比例 比率 百分比 频数分布多选题:(1)下列属于品质变量的有( )
7、 产品等级 人口受教育年限 经济类型 用户满意度(2)从变量的性质看,下列属于连续变量的有( ) 商品销售额 邮电业务量 企业人数 人均GDP(3)普查属于( )全面调查和经常性调查 专门组织的调查一次性调查和全面性调查 非全面调查和一次性调查(4)统计分组的主要作用有( )划分现象的类型 反映总体的内部结构及数量关系研究现象之间的依存关系 反映总体的基本情况(5)对离散型变量分组( ) 首位两组一定采用闭口组限 可采用单变量值分组可进行组距式分组 组限可以断开也可以重叠组限必须重叠(6)对连续型变量编制次数分布数列( ) 只能用组距式分组 相邻
8、组的组限必须重叠 组距可相等也可不等 首尾两组一定得采用开口组首尾两组一定得采用闭口组 (7)组距式数列中,影响各组次数分布的要素有( ) 总体单位数的多少 变量值的大小 组数 组距 组限4、方法应用题41 某家用电器生产厂家想通过市场调查了解以下问题: a 企业产品的知名度; b 产品的市场占有率 c 用户对产品质量的评价及满意度。 要求:(1)请设计出一份调查方案; (2)设计出一份调查问卷。答: (1)调查方案的基本内容: 调查目的:了解某家用电器厂企业产品的知名度; 产品的市场占有率;用户对该厂产品质量的评价及满意度。 调查对象:一定区域内所有居民家庭 调查单位:调查区域内的
9、每一居民家庭 调查内容:见问卷,根据调查目的确定 调查方式与方法:抽样调查、访问法 调查工作的起止时间: 调查工作的组织与实施计划:主要包括调查人员的培训、经费的预算和管理、调 查工作的组织机构及人员构成等。 (2) 问卷 ×××家用电器市场调查问卷 尊敬的先生、女士:您好! 我们是×××市场调研公司,为了了解广大用户对×××家用电器的使用及满意程度, 可以占用您几分钟时间问几个问题吗?希望得到您的合作,谢谢! A:被调查者基本情况资料 A1:您家中有( )口人。 A2:您家的年人均收入 (A)400 元
10、以下 (B) 400800 元 (C) 8001200 元 (D) 12002000 元(E) 20003000 元 (F) 3000 元以上 A5:您知道×××家用电器吗?(若“知道” ,继续选答以下问题,若“不知道” ,停止选答) (A) 知道 (B)不知道 B1:您对×××家用电器了解多少? (A)非常了解 (B)一般 (C)了解一点 (D)不了解 B2:您知道×××家用电器厂生产的那些家电产品(A) 电视机 (B) 电冰箱(C) 洗衣机 (D) 微波炉(E)空调B3:您听过有人谈及xxx家用电器吗
11、?(A) 经常听到 (B)偶尔听到 (C)没听过B4:您家中是否购买xxx家用电器?(若回答“是”,继续回答以下问题,若回答“否”,停止答)(A) 是 (B) 否C1:您加重购买了xxx家用电器厂生产的哪些家用电器? (A)电视机(B)电冰箱(C)洗衣机(D)微波炉(E)空调(F)其它C2:您觉得×××家用电器产品质量如何?(A)非常好(B)比较好(C)一般(D)不太好(E)非常不好C3:您认为×××家用电器产品质量不好有:(A)电视机(B)电冰箱(C)洗衣机(D)微波炉(E)空调(F)其它C4:您对×××
12、;家用电器厂的服务质量是否满意?(A)很满意(B)比较满意(C)一般(D)不太满意(E)很不满意C5: 您对XXX家用电器厂以下那些服务不满意?(A)咨询服务(B)销售服务(C)维修服务(D)投诉服务(G)其它 谢谢合作! 2012年4月10 日42 根据下述某地区30个企业的职工人数和总产值资料,用分组法说明企业规模与劳动生产率之间的依存关系,并将分组结果用统计表表示。 某地区30个企业的职工人数和总产值资料企业编号职工人数(人)总产值(万元)企业编号职工人数(人)总产值(万元)134525161200148248541171140115351537181300157462250192301
13、3552544202501564173021262167750632224512865555232801888156424122515910925852514401631187868261521185127957127150019013840742816242101444532299559215932863056243 答:某地区30个企业企业规模与劳动生产率依存关系按职工人数分组总人数(人)总产值(万元)劳动生产率(元/人)200-5002959202682.66500-8004424363820.52800-11005345469877.461100-14004865579119
14、0.131400-170060857481229.2543 某行业管理局所属40个企业2001年的产品销售收入数据如下(单位:万元)152 124 129 116 100 103 92 95 127 104105 119 114 115 87 103 118 142 135 125117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 如果按企业成绩规定:销售收入在125万元以上为先进企业,115125万元为良好企业,105115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一
15、般企业、落后企业进行分组,并根据分组结果绘制条形图和圆饼图。答:(1)某行业管理局所属40个企业1999年产品销售收入频数分布表组距分组界限频数频率向上累计向下累计累计频数累计频率累计频数累计频率85-959438%38%40100%95-105104615%923%3793%105-115114923%1845%3178%115-1251241128%2973%2255%125-135134410%3383%1128%135-145144513%3895%718%145-155515425%40100%25%合计-40100%-(2)按销售收入分组频数频率先进1127.5良好1127.5一般
16、922.5落后922.5合计40100第四章 数据分布特征的描述习题一、 填空题1、数据分布集中趋势的测度值(指标)主要有 众数 、 中位数 和 均值 。其中 众数 和 中位数 用于测度品质数据集中趋势的分布特征, 均值 用于测度数值型数据集中趋势的分布特征。2、标准差是反映 数据离散程度 的最主要指标(测度值)。3、几何平均数是计算 平均比率 和 平均速度 的比较适用的一种方法。4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算 标准系数 。5、在测定数据分布特征时,如果,则认为数据呈 对称 分布。6、当一组工人的月平均工资悬殊较大时,用他们工资的 众数(中位数 比其算术平均
17、数更能代表全部工人工资的总体水平。二、 选择题单选题:1、按反映的时间状况不同,总量指标可分为( ) 总量指标和时点总量指标 时点总量指标和时期总量指标 时期总量指标和时间指标 实物量指标和价值量指标2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( ) 5.5% 5% 115.5% 15.5%3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( )(1) 接近标志值小的一方 (2)接近标志值大的一方(3)接近次数少的一方 (4)接近哪一方无法判断4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( ) (1)
18、可变的 (2)总是各组单位数(2) 总是各组标志总量 (4)总是各组标志值5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( ) (1)提高 (2)不变 (3)降低 (4)不能做结论6、在变异指标(离散程度测度值)中,其数值越小,则( )(1)说明变量值越分散,平均数代表性越低(2)说明变量值越集中,平均数代表性越高(3)说明变量值越分散,平均数代表性越高(4)说明变量值越集中,平均数代表性越低7、有甲、乙两数列,已知甲
19、数列:;乙数列:根据以上资料可直接判断( )(1)甲数列的平均数代表性大(2)乙数列的平均数代表性大(3)两数列的平均数代表性相同(4)不能直接判别多选题:1、某企业计划2000年成本降低率为8%,实际降低了10%。则以下说法正确的是( )该企业的计划完成程度为10%/8%=125%该企业的计划完成程度为110%/108%=101.85%该企业的计划完成程度为90%/92%=97.83%该企业未完成计划任务该企业超额完成了计划任务2、下列那些指标属于结构相对指标( ) 废品率 平常函件差错率 电话机普及率 生产工人占全部职工的比重了 产值利税率3、 应采用算术平均数计算的有( )(1)已知工资
20、总额及工人数求平均工资(2)已知计划完成百分比和实际产值,求平均计划完成百分比(3)已知计划完成百分比和计划产值,求平均计划完成百分比(4)已知某厂1990到1995年的产值,求平均发展速度4、标志变异指标(离散程度测度值)的主要作用()(1)衡量平均数代表性的大小(2)可以反映总体单位的均匀性和稳定性(3)可以反映社会经济活动过程的节奏性和均衡性(4)科学地确定必要抽样单位的因素 (5)分析社会经济现象某总体的变动趋势5、加权平均数的大小受下列那些因素的影响( )(1)受各组频数或频率的影响 (2)受各组值大小的影响(3)受各组变量值和频数的共同影响(4)只受各组变量值的影响 三、 简答题1
21、、 在考察数据分布特征时,如何正确的选择集中趋势的测度值。答:首先要根据数类型选择集中趋势的测度值,定类数据选择众数,定序数据选择中位数数或分位数,数值型数据则一般选用均值;此外,对于数值型数据,还需要进一步根据数据的分布特征进一步选择不同的集中趋势测度值。当数据成对称分布或接近对称分布时,应选择均值作为集中趋势的测度值;当数据为偏态分布,特别是偏斜的程度较大时,应选择众数或中位数作为集中趋势的代表值。2、述平均指标(集中趋势测度值)与变异指标(离散程度测度值)之间的关系。答:平均指标和变异指标都是说明数据分布特征的测度值,其中平均指标说明数据分布的集中趋势,而变异指标则说明数据分布特征的离中
22、趋势,两者从不同的方面反映数据的分布特征。两者既有区别也有联系,联系主要表现为变异指标可以衡量平均指标的代表性大小,根据一组数据计算的变异指标大,其平均数的代表性就差;变异指标小,其平均数的代表性就大。3、什么是标准差系数?为什么要计算标准差系数?答:标准差系数又称为离散系数,它是一组数据的标准差与其相应的均值之比,是测度离散程度的相对指标。计算离散系数主要是为了消除变量值高低和计量单位不同对离散程度测度值的影响。离散系数主要用于变量值高低和计量单位不同的数据之间离散程度的对比。四、计算题1、某地电信局每月固定收取每部电话16元,用户每拨一次电话安使用时间每分钟0.1元收费。以下是6个用户的时
23、间,计算6个用户本月使用电话的平均时间,使用电话的时间标准差。本月平均每户电话费的标准差。用户123456使用时间90508010040120 解:(1) 平均时间=(2) 时间标准差=27.69(分钟)(3) 平均电话费=(4) 电话费标准差=2.77(元)2、 企业60名工人包装某产品的数量资料如下:工人按日包装数量分组(件)工人数4月份五月份400以下400500500600600700700800800以上513181572351220155合计6060试计算4、5月份的劳动生产率,并指出4、5月劳动生产率高低不等的原因。解:(件/人)(件/人)3、 某管理局所属企业按职工劳动生率高低
24、分组如下:按劳动生率分组(元/人)企业数各组总产值5006006007007008008009009001000853218250065000525002550015200计算:工人平均劳动生产率。 解: 4、甲、乙两局二月份打往美国(单价:15元/分)方向的去话业务收入资料如下:时段优惠业务收入甲局乙局721点2124点07点-20%40%150002400016200225001800018000 试问哪个局的平均单价高?并说明原因。解: 原因:乙局7-21点之间的业务量相对较多。5、有甲、乙两单位,甲单位的平均工资为950元,标准差为140元。乙单位工资资料如下:职工按工资分组职工人数(
25、人)7008001008009002009001000400100011002001100以上100合计1000 用尽可能简便的方法比较甲、乙两单位工人平均工资的代表性大小。 解: (元) (元) 因甲乙两单位的平均工资相等,且甲单位的标准差较大。因此乙单位平均工资的代表性较大。6、 百货公司6月份各天的销售额数据如下(单位:万元) 257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269 295(1)计算该百货公司日销售额的
26、均值、众数、中位数;274.1、 、272.5(2)计算该百货公司日销售额的极差、标准差;86、21.174725(3)计算日销售额分布的偏态系数和峰度系数。(注:上机用Excel完成)0.159087、-0.2119187、根据以下资料分别计算男女学生的年龄、身高、体重的平均值和标准差编号姓名性别年龄身高体重1陈红女1214543.12王玉女1214955.83刘丽丽女1213533.64张倩女1216265.85刘英丽女1212729.16李飞男1214738.17李强男1214958.18刘洪男1312535.99李花女1314750.810刘乐女1314948.611张晓英女13137
27、30.412张鹏男1315944.513刘伟男1315447.714吴军男1314243.115刘小伟男1414535.916李丽君女1414936.817贾玲玲女1415241.318刘锦琦女1415964.519张虹源女1415438.120李丽霞女1415238.621吴龙飞男1415442.222刘涛男1415744.923张金星男141595424宋毅男1415741.825王洪飞男1416750.826刘建功男1415744.927张均男1516951.328张莹莹女1515241.829马晓云女1515750.830张海军男1516458.131王建男1515950.432刘云龙
28、男1616247.733李帆男1715247.234樊晓霞男1616248.135刘莎女1615950.836吴丽英女1614752.237周虎男1616758.138刘胜利女1715252.739张仲男1716760.840李哲男1717278.1(运用Excel的分类汇总功能完成)8、 根据第7题的资料计算:(1)年龄15岁以上的人数;(2)身高160以上学生的平均身高。9、1997年我国城乡居民家庭平均每人生活消费支出数据如下表: 1997年城乡居民家庭平均每人生活消费支出 项目城镇居民农村居民食品家庭设备用品及服务医疗保健交通运输娱乐教育文化服务居住杂项商品与服务1942.59520.
29、91316.89179.68232.90448.38358.64185.65890.28109.4185.4162.4553.92148.18233.2334.27合计4185.641617.15 是根据以上资料绘制雷达图,并分析我国城乡居民消费结构的差异。 (注:上机用Excel完成) 消费差异:根据雷达图显示可知,城镇居民和农村居民的食品消费都占据了自己总支出的很大比重,在满足了食品消费后,城镇居民将支出更多的放在了居住上,而农村居民将支出更多的放在了杂项商品与服务上,另外,可以看出,农村居民的交通运输和娱乐教育文化服务还有医疗保健方面极其薄弱,并且在衣着支出上更是明显远低于城镇居民,相较
30、之下城镇居民在各个方面都是较为全面,钱的支出方向较多,也是源于城镇的消费多样化。 第5章 抽样与抽样估计复习题一、 填空题 1、在实际工作中,人们通常把 n 30 的样本称为大样本,而把 n30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有 样本均值、样本比例 、 样本标准差 或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则 有许多个 。 4、在抽样调查中, 登记性误差和 系统性误差 都可以尽量避免,而 抽样误差 则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指 用于估计总体参数的样本指标(统计量),评价估计量优劣的标准
31、有 无偏性 、 有效性 和 一致性。二、 选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须() (1)增加到原来的3倍 (2)增加到原来的9倍 (3)增加到原来的6倍 (4)也是原来的1/32、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用()(1)简单随机抽样 (2) 等距抽样 (3)分层抽样 (4) 整群抽样3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1小时的全部产进行检验,这种方式是( )(1)简单随机抽样 (2) 等距抽样 (3)分层抽样 (4) 整群抽样4、其它条件一定,抽样推断的把握
32、程度提高,抽样推断的准确性就会( ) (1)提高 (2)降低 (3)不变 (4)不一定降低5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为0.8分钟,则概率为0.9545时,通话平均持续时间的抽样极限误差为( ) (1)0.8 (2)0.16 (3)0.84 (4)3.166在抽样调查中,样本量是指( )。A样本的个数B样本所包含的单位数C抽样框的大小D样本的可能数目7在抽样框中每隔一定距离抽选样本单位的调查方式是( )。A整理抽样B系统抽样C分层抽样D简单随机抽样8、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平
33、均年龄,则平均年龄抽样平均误差( ) (1)两者相等 (2)前者比后者大 (3)前者比后者小 (4)不能确定大小9假设检验中第二类错误是指( )。A接受正确原假设B拒绝正确原假设C接受错误原假设D假设设立不正确10当总体为正态总体,方差已知,样本量为40,此时进行均值检验,应采用( )统计量进行检验。A卡方BtCFDZ 多选题: 1、降低抽样误差,可以通过下列那些途径( )(1)降低总体方差 (2) 增加样本容量。(3)减少样本容量 (4) 改重复抽样为不重复抽样(5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差( ) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3
34、)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差( )(1)是所有可能的样本指标与总体指标之间的误差范围(2)也叫允许误差 (3)与所做估计的概率保证程度成反比(4)通常用来表示抽样结果的精确度4、影响样本容量的因素有( ) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小5、不重复抽样的抽样平均误差( )(1)总是大于重复抽样的抽样平均误差(2)总是小于重复抽样的抽样平均误差(3)有时大于,有时小于重复抽样的平均误差(4)在很小时,几乎等于重复抽样的抽样平均误差6、从3000名职工中随机
35、抽取400名调查收入水平,共抽了( ) (1)一个样本 (2)400个样本 (3)一个样本总体 (4)400各样本总体 (5)400个样本单位7评价估计量的标准为( )。A一致性B无偏性 C显著性D有效性 E综合性8、简单随机抽样一般适合于( )(1) 具有某种标志的单位均匀分布的总体(2) 具有某种标志的单位存在不同类型的总体(3) 现象的标志变异程度较小的总体(4) 不能形成抽样框的单位(5) 总体单位可以编号的总体三、 简答题1、 什么是抽样平均误差?影响抽样平均误差的因素有哪些?答:抽样平均误差是所有可能的样本指标与被估计的总体参数之间的平均离差,即样本指标的标准差。其影响因素有:总体
36、方差 样本容量 抽样方法 抽样的组织形式2、 抽样调查适合于那些场合?答:与其他抽样调查方式相比,抽样调查有经济性、时效性强、准确性高等特点,所以在实际中得到广泛的应用。具体看来,抽样调查主要用于以下场合:对无限总体全面资料的了解;具有破坏性的产品质量检测;对全面调查的结果进行验证和修整3、 为什么重复抽样的抽样平均误差大于不重复抽样的抽样平均误差?答:因为在重复抽样情况下,最大(最小)的样本指标等于最大(最小)的变量值;而不重复抽样情况下,最大的样本指标小于最大的变量值,最小的样本指标大于最小的变量值。因此,重复抽样下的样本指标的变动范围大于不重复抽样下的样本指标变动范围,这就必然就有,重复
37、抽样下的样本指标的标准差大于不重复抽样下的样本指标的标准差。而抽样平均误差就是样本指标的标准差,所以,重复抽样的抽样平均误差大于不重复抽样的抽样平均误差4、 点估计与区间估计的区别是什么?答:点估计是直接以一个样本估计量来估计总体参数,当已知一个样本的观察值时,便可得到总体参数的一个估计值。其估计过程简单明了,但估计结果的误差大小和把握性无法衡量。区间估计是以点估计值为基础,加减一个误差范围来估计总体参数所在的可能范围。估计过程既考虑了样本指标,又考虑了样本指标的分布,从而能对估计的把握性和误差大小进行说明。5、 基本的抽样组织形式有哪些?它们各有什么特点?(财管0203班不做)答:抽样估计的
38、基本形式有:(1) 简单随机抽样:其特点是:最符合随机原则,其计算公式可以在理论上得到证明;但由于抽样时,需要对每一个单位进行编号,实际应用受到很大的限制。(2) 分层抽样(类型抽样):可以降低抽样误差,提高样本的代表性。(3) 等距抽样:抽样单位均匀的分布于总体中,比简单随机抽样的误差小;其抽样误差需借助其它抽样组织形下的误差公式计算;均采用不从复抽样。(4) 整群抽样:抽样组织工作简便,但误差较大,通常也只采用不重复抽样。四、 计算题1、 一家广告公司想估计某类商店去年所花的平均广告费有多少。经验表明,总体方差约为1800000。如置信度取95%,并要使估计值处在总体平均值附近500元的范
39、围内,这家广告公司应取多大的样本?(Z2 =1.96 ) 解:(个)2、 对一批平常函件按不重复抽样的方法抽取200件,其中免费信件8件.又知道抽样是该批平常函件的1/20,当=0.0455时,能否认为该批平常函件,免费函件所占的比重不超过5%?并以免费函件所占比重推断该批平常函件免费函件量的范围。解:(1)不能认为免费函件所占比重不超过5%(2)3、 设某邮局某月份平常函件的重量服从正态分布,从该月份收寄的平常函件中随机抽查100千克,测得总件数为17600件,它们的平均重量为5.68g,已知总体标准差=1.5g,试以95%的概率保证程度,确定该局该月份平常函件平均重量的置信区间。解:4、
40、从某商店一年来的发票存根中随机抽取26张,算得平均金额为78.5元,样本标准差为20元,假定发票金额为正态分布,试求出该商店一年来发票平均金额90%的置信区间。(Z=1.68,T=1.708)5、在某一地区中,随机地对100名成年居民做民意测验,有80%的居民支持粮食调价,求在该地区的所有居民中,支持粮食调价的居民的比率的95%置信区间 第六章 相关与回归分析习题一、 填空题 1、客观现象之间的数量联系有两种不同的类型:一种 函数关系 ;另一种是 相关关系 。 2、现象之间是否存在 相关关系 是进行相关与回归分析的基础,其主要测定方法是计算 相关系数 。 3、若估计标准误差愈小,则根据直线回归
41、方程计算的估计值就 越能代表实际值 。4、对某实验结果做线性回归分析,得到形如y=a+bx的方程,现对回归系数b做显著性检验,该假设检验中原假设为H0:b=0,备择假设为H1:b0,若拒绝原假设,则认为 x对y有显著的影响 。二、 选择题单选题:1、相关分析对资料的要求是( ) (1)两变量均为随机的 (2)两变量都不是随机的 (3)自变量是随机的,因变量不是随机的 (4)因变量是随机的,自变量不是随机的2、回归方程Y=a+bx中的回归系数b说明自变量变动一个单位时,因变量( ) (1)变动a+b个单位 (2)变动1/b个单位 (3)变动b个单位 (4)平均变动b个单位3、相关系数r的取值范围
42、( )(1) <r<+ (2)1r+1 (3)1<r<+1 (4)0r+1 4下列四个相关系数中反映变量之间关系最密切的数值是( )。A0.6B0.91 C-0.8D-0.955度量了因变量与k个自变量的总体相关程度的指标为( )。A相关系数B多重相关系数 C多重判定系数D估计标准误差 多选题: 1、下列现象之间的相互关系,属于相关关系的有( )(1)生产费用与生产量 (2)设备的使用年限与维修费用(3)圆的半径与面积 (4)身高与体重(5)一定价格下的销售量与销售收入 2、相关系数r=0.9,这表明现象之间存在( )(1)高度相关关系 (2)低度相关关系(3)正相关关
43、系 (3)负相关关系(5)函数关系 3、回归模型可用于( )(1)反映变量之间一般的数量变动关系 (2)预测(3)反映变量之间相互关系的密切程度 (4)反映变量之间的变动方向 4、相关关系按其变动方向的不同可分为( )。A完全相关B负相关 C非线性相关D不完全相关 E正相关三、 简答题1、 什么是相关关系?相关关系有什么特点?答:相关关系是指变量之间所存在的一种不严格的数据依存关系。表现在给确定自变量一值,因变量有若干数值与之对应。并且因变量y总是遵循一定的规律围绕着这些书的平均数上下波动。特点:自变量与因变量在数值上不是一一对应的。2、 相关关系分析的主要方法有哪些?答:(1)相关分析:用于
44、分析变量之间相关关系的密切程度。其分析方法有:绘相关图表法和计算相关系数。(2)回归分析:用于分析相关关系变量之间一般的数据变动关系,即自变量发生变化时,因变量平均会发生多大的变化。其分析方法是:建立回归方程3、 简述回归分析的基本思路。答:在相关分析的基础上,通过建立回归方程分析具有相关关系的变量之间一般的数量变动关系。即自变量发生变化时,因变量平均会发生多大的变化。四、 计算题1、 某邮电局近11年来平常函件业务量与该地区人口统计数据如下: 函件业务量(万件)2020252030304020504045人口数(万人)385400395365375440490420460525480试建立平
45、常函件业务量对人口数的线性回归方程,并确定人口数为500万人时的可能函件业务量。(不做)2、 某种产品的产量与单位成本的资料如下:产量(千件)单位成本(元/件)234345737271736968要求:(1)计算相关系数,判断其相关方向和程度;0.90909;高度负相关(2) 建立直线回归方程。 Y=77.364-1.8182x b=1.8182产量每增1千件,单位成本平均下降1.81823、 某地高校教育经费(x)与高校学生人数(y)连续六年的通及资料如下:教育经费(万元)x在校学生数(万人)y316343373393418455111618202225 要求:(1)建立回归直线方程,估计教
46、育经费为500万元的在校学生数;(2) 计算估计标准误差。(1) y=-17.92+0.0955x y(500)=29.83(万人)(2) Sy=0.9299544、对20名青少年的身高Y和体重X进行观测,并得出以下数据:=13.54 =472 =803.02 =22.9788 =28158 要求:1、以身高为因变量,体重为自变量,建立线性回归方程;2、计算可决系数;3、计算身高与体重的相关系数;4、对x的回归系数进行显著性检验。5、为预测我国居民家庭对电力的需求量,建立了我国居民家庭电力消耗量(单位:千瓦小时)与可支配收入(X1,单位:百元)、居住面积(X2,单位:平方米)的多元线性回归方程
47、,如下所示:请根据上述结果,从下列备选答案中选出正确答案。1)对于多元线性回归模型,以下假设中正确的有( )。A因变量与自变量之间的关系为线性关系B随机误差项的均值为1C随机误差项之间是不独立的D随机误差项的方差是常数2)回归系数的经济意义为( )。A我国居民家庭居住面积每增加1平方米,居民家庭电力消耗量平均增加0.2562千瓦小时B在可支配收入不变的情况下,我国居民家庭居住面积每增加1平方米,居民家庭电力消耗量平均增加0.2562千瓦小时C在可支配收入不变的情况下,我国居民家庭居住面积每减少1平方米,居民家庭电力消耗量平均增加0.2562千瓦小时D我国居民家庭居住面积每增加1平方米,居民家庭
48、电力消耗量平均减少0.2562千瓦小时3)根据计算上述回归方程式的多重判定系数为0.9235,其正确的含义是( )。A在Y的总变差中,有92.35%可以由解释变量X1和X2解释B在Y的总变差中,有92.35%可以由解释变量X1解释C在Y的总变差中,有92.35%可以由解释变量X2解释D在Y的变化中,有92.35%是由解释变量X1和X2决定的4)根据样本观测值和估计值计算回归系数的t统计量,其值为t=8.925,根据显著性水平()与自由度,由t分布表查得t分布的右侧临界值为2.431,因此,可以得出的结论有( )。A接受原假设,拒绝备择假设B拒绝原假设,接受备择假设C在95%的置信水平下,是由这样的总体产生的D在95%的置信水平下,居住面积对居民家庭电力消耗量的影响是显著的5)检验回归方程是否显著,正确的假设是( )。A;B;C;D;至少有一个不
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025版航空航天设备安装劳务分包合同
- 2025年石油化工安装工程内部承包合同示范文本
- 二零二五版智能家居装修设计与施工合同
- 二零二五年度车辆抵押担保汽车保险合同
- 二零二五版电视剧剧本创作合同终止协议
- 2025版高端酒店场地租赁合同模板
- 2025版商业地产场地租赁分成合同示范文本
- 2025版智能仓储厂房租赁安全协议范本
- 2025版早餐店连锁经营合作协议
- 2025版仓储物流园区建设承包管理合同样本
- CJ/T 30-2013热电式燃具熄火保护装置
- 2025贵州省水利投资(集团)有限责任公司招聘84人笔试备考题库附答案详解(巩固)
- 调岗协议书合同补充
- 2025香河事业单位笔试真题
- 2025年山东省普通高校招生(春季高考)全省统一考试语文试题
- 2025年护士考试理论知识整合试题及答案
- 门诊部医保管理制度
- 三通四通尺寸数据及标准表
- 面神经炎中医的护理常规
- 护理质量成果改善项目
- 中国健康体育课程模式
评论
0/150
提交评论