示范教案(用样本的数字特征估计总体的数字特征_第1页
示范教案(用样本的数字特征估计总体的数字特征_第2页
示范教案(用样本的数字特征估计总体的数字特征_第3页
示范教案(用样本的数字特征估计总体的数字特征_第4页
示范教案(用样本的数字特征估计总体的数字特征_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、2.2.2 用样本的数字特征估计总体的数字特征整体设计 教学分析教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数的概念 ,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现 ,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面 ,教科书通过思考栏目让学生注意到 ,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在得到这个结论后 , 教师可以举一反三 ,使学生思考对于众数和平均数,是否也有类似的结论 .进一步 ,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本数据的具体数值时 ,通常通

2、过样本计算中位数、 平均值和众数 ,并用它们估计总体的中位数、 均值和众数 .但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数的估计 .教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性思维的过程 .教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考栏目 “生产过程中的质量控制图 ”让,学生进一步体会分布的数字特征在实际中的应用 . 三维目标1. 能利用频率分布直方图估计总体的众数、中位数、平均

3、数;能用样本的众数、中位数、平 均数估计总体的众数、中位数、平均数,并结合实际 ,对问题作出合理判断 ,制定解决问题的有效方法;初步体会、领悟 “用数据说话 ”的统计思想方法;通过对有关数据的搜集、整理、分 析、判断,培养学生 “实事求是 ”的科学态度和严谨的工作作风 .2. 正确理解样本数据标准差的意义和作用,学会计算数据的标准差; 能根据实际问题的需要合理地选取样本 ,从样本数据中提取基本的数字特征(如平均数、 标准差) ,并作出合理的解释;会用样本的基本数字特征估计总体的基本数字特征, 形成对数据处理过程进行初步评价的意 识.3. 在解决统计问题的过程中,进一步体会用样本估计总体的思想,

4、理解数形结合的数学思想和逻辑推理的数学方法; 会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题 认识统计的作用 ,能够辨证地理解数学知识与现实世界的联系.重点难点 教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基本数字特征;体会样本数字特征具有随机性 .教学难点: 用样本平均数和标准差估计总体的平均数与标准差; 能应用相关知识解决简单的 实际问题 .课时安排2 课时教学过程第 1 课时 众数、中位数、平均数 导入新课思路 1在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:甲运动员 :7,8,6,8,6,5,8,10,7,4; 乙运动员

5、:9,5,7,8,7,6,8,6,7,7.观察上述样本数据 ,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握 总体的规律 ,我们要通过样本的数据对总体的数字特征进行研究. 用样本的数字特征估计总体的数字特征.(板书课题)思路2在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然 不能把所有灯泡一一测试,因为测试后灯泡则报废了 于是,需要通过随机抽样,把这批灯泡的 寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征来估计总体的数字特征.推进新课新

6、知探究提出问题什么是众数、中位数、平均数?(1)如何绘制频率分布直方图?(3)如何从频率分布直方图中估计众数、中位数、平均数?活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导讨论结果:(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均 数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定组距与组数;将数据分组;列频率分布表;画频率分布直方图(3)教材前

7、面一节在调查 100位居民的月均用水量的问题中,从这些样本数据的频率分布直方图可以看出,月均用水量的众数是 2.25 t (最高的矩形的中点),它告诉我们,该市的月均用水 量为2.25 t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少请大家翻回到课本看看原来抽样的数据,有没有2.25这个数值呢?根据众数的定义,2.25怎么会是众数呢?为什么?(请大家思考作答)分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数据的频率分布直方图得来的,所以存在一些偏差(1.541 D.400.300.2C0.W0OJ I 1J 2 2J 3 3.5 4 4

8、.5 月同用水董巾提问:那么如何从频率分布直方图中估计中位数呢?分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数 因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小 ,即中位数左边和右边的直 方图的面积应该相等由此可以估计出中位数的值为 2.02.思考:2.02这个中位数的估计值,与样本的中位数值 2.0不一样,你能解释其中的原因吗?(原因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)课本显示,大部分居民的月均用水量在中部(2.02 t左右),但是也有少数居民的月均用水量特别高,显然,对这部分居民的用水量作出限制是非常合理的 思考:中位数不

9、受少数几个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)并不会对样本中位数产生影响也就是说对极端数据不敏感的方法能够有效地预防错误数据的影响,而在实际应用中,人为操作的失误经常造成错误数据对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作 这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒 这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数对极小的数据不敏感这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均工资较高且中位数较

10、大的公司就业对极端值不敏感的方法,不能反映数据中的极端情况同样的,可以从频率分布直方图中估计平均数 ,上图就显示了居民用水的平均数 ,它等于 频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和由估计可知,居民的月均用水量的平均值为 2.02 t.显示了居民月均用水量的平均数,它是频率分布直方图的重心”由于平均数与每一个样本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变这是中位数、众数都不具有的性质也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数 据全体的信息从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的月均用水量与平均数相

11、差太多了利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计 样本众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息 ,描述了数据的平均水平,是一组

12、数据的重心”.应用示例思路1例1(1 )若 M个数的平均数是 X,N个数的平均数是 Y,则这 M+N个数的平均数是?(2)如果两组数X1,X2,,x和yi,y2,,y的样 本平均数分别是x和y,那么一组数xi +y1,X2+y2,x+y n 的平均数是 .活动:学生思考或交流,教师提示,根据平均数的定义得到结论解:(1)MX NY;M N(2)乞2例2 某校高一年级的甲、 乙两个班级(均为50人)的语文测试成绩如下 (总分:150分) 试确定这次考试中,哪个班的语文成绩更好一些.甲班:1128610684100105981029410787112949499901209895119108100

13、961151111049510811110510410711910793102981121129992102938494941009084114乙班:,因此,分别求出甲、乙两个班的116951099610698108991101039498105101115104112101113961081001109810787108106103971071061111219710711412210110710711111410610410495111111110分析:我们可用一组数据的平均数衡量这组数据的集中水平平均分即可.解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考

14、试乙班成绩要好于甲班.思路2例1下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间.睡眠时间人数频率:6,6.5)50. 056.5,7)170. 177,7.5)330. 337.5,8)370. 37:8,8.5)60. 06:8.5,9)20. 02合计1001分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡 眠时间只是一个范围,可以用各组区间的组中值近似地表示.解法一:总睡眠时间约为6.25 3+6.75 7+7.25 33+7.75 87+8.25 8+8.75 2=739 (h)故平均睡眠时间约为7.39 h .解

15、法二:求组中值与对应频率之积的和6.25 0.05+6.75 07+7.25 033+7.75 0.37+8.25 0.06+8.75 0.02=7.39 (h).答:估计该校学生的日平均睡眠时间约为7.39 h .例 2 某单位年收入在 10 000 到 15 000、15 000 到 20 000、20 000 到 25 000、25 000 到 30 000、 30 000至U 35 000、35 000至U 40 000及40 000至U 50 000元之间的职工所占的比分别为 10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.分析:上述百分比就是各组

16、的频率.解:估计该单位职工的平均年收入为12 500 10%+17 500 15%+22 500 320%+27 500 25%+32 500 XI5%+37 500 刈0%+45 000 5%=26 125(元).答:估计该单位人均年收入约为26 125元.知能训练从甲、乙两个公司各随机抽取50名员工月工资:甲公司:80080080080080010001 0001 0001 0001 0001 0001 0001 0001 00010001200120012001 2001 2001 2001 2001 20012001 2001 2001 2001 2001 2001 2001 2001

17、 20012001 2001 2001 5001 5001 5001 5001 5001 50015002 0002 0002 0002 0002 0002 5002 5002 500乙公司:7007007007007007007007007007007007007007007001 0001 00010001 0001 0001 0001 0001 0001 0001 0001 00010001 0001 0001 0001 0001 0001 0001 0001 00010001 0001 0001 0001 0001 0001 0001 0001 00010001 0001 0006 0

18、008 00010 000试计算这两个公司 50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资 答案:甲公司:员工月工资平均数1 240,众数1 200,中位数1 200;乙公司:员工月工资平均数 1 330,众数1 000,中位数1 000;从总体上看乙公司员工月工资比甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数拓展提升用数据说话”这是我们经常可以听到的一句话但是,数据有时也会被利用,从而产生误导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层次的人,年收入可以达到几十万元这时,年收入的平均数会比中位数大得多尽管这时中位数比平

19、均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回答有关工资待遇方面的提问你认为 我们单位的收入水平比别的单位高”这句话应当怎么解释?这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确理解在日常生活中像我们单位的收入水平比别的单位高”这类话的模糊性,这里的 收入水平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含义.在这里应该注意以下几点:1样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分类变量的中心位置2中位数不受少数几个极端数据 (即排序靠前或排

20、序靠后的数据 )的影响,容易计算,它仅利用 了数据中排在中间数据的信息 当样本数据质量比较差,即存在一些错误数据(如数据的录入 错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟样本,向学生展示错误数据对样本中位数的影响程度 3平均数受样本中的每一个数据的影响,越离群”的数据,对平均数的影响也越大与众数和中位数相比,平均数代表了数据更多的信息当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差可以利用计算机模拟样本,向学生展示错误数据对样本平均数的影响程度在体育、文艺等各种比赛的评分中,使用的是平均数计分过程中采用 去掉一个最高分,

21、去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或 过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公 平性4如果样本平均数大于样本中位数 ,说明数据中存在许多较大的极端值 ;反之,说明数据中存在 许多较小的极端值在实际应用中,如果同时知道样本中位数和样本平均数 ,可以使我们了解 样本数据中极端数据的信息,帮助我们作出决策5使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一些误导作用课堂小结1 能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数)会用样本的基本数字特征估计总体的基本数字特征;2 平均数对数据有 取齐

22、”的作用,代表一组数据的平均水平;3 形成对数据处理过程进行初步评价的意识. 作业习题2.2A组3.设计感想本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧 扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众 数、中位数、平均数,对总体作出正确的估计(设计者:路波)第2课时标准差导入新课思路1平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片面判断某地区的统计显示,该地区的中学生的平均身高为176 cm,给我们的印象是该

23、地区的中学生生长发育好,身高较高但是,假如这个平均数是从五十万名中学生抽出的五十名身高 较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质因此,只有平均数难以概括样本数据的实际状态所以我们学习从另外的角度来考察样本数据的统计量一一标准差(教师板书课题)思路2在一次射击选拔比赛中,甲、乙两名运动员各射击 10次,命中环数如下:甲运动员:7,8,7,9,5,4,9,10,7,4 ;乙运动员 95,7,8,7,6,8,6,7,7.观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手去参加正式比赛?我们知道,x甲=7, x乙=7两个人射击的平均成绩是

24、一样的那么,是否两个人就没有水平差距呢?卩从上图直观上看,还是有差异的很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们 从另外的角度来考察这两组数据一一标准差推进新课新知探究提出问题(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2), 通过计算发现,两个样本的平均数均为 125.甲110120130125120125135125135125乙115100125130115125125145125145哪种钢筋的质量较好?(3) 某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行

25、了连续7年的种植对比实验,年亩产量分别如下:(千克)甲:600, 880, 880, 620, 960, 570, 900(平均 773) 乙:800, 860, 850, 750, 750, 800, 700(平均 787) 请你用所学统计学的知识,说明选择哪种品种推广更好?(4) 全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达到1.5万元的家庭即达到小康生活水平民政局对该市100户家庭进行调查统计,它们的人均收入达到了 1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否符合实际?(5) 如何考查样本数据的分散程度的大小呢?把数据在坐标

26、系中刻画出来,是否能直观地判断数据的离散程度?讨论结果:(1) 利用频率分布直方图估计众数、中位数、平均数:估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)估计中位数:中位数把频率分布直方图分成左右两边面积相等估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和由上图可以看出,乙样本的最小值100低于甲样本的最小值 110,乙样本的最大值145高 于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙

27、稳定.运用极差对两组数据进行比 较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.(3) 选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.(4) 不符合实际.样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题, 都是考察数据的分散程度.把问题 中的数据在坐标系中刻画出来我们可以很直观地知道,乙组数据比甲组数据更集中在平均数的附近,即乙的分散程度小,如何用数字去刻画这种分散程度呢?考察样本数据的分散程度的大小,最常用的统计量是方差和标准差.标准差:考察

28、样本数据的分散程度的大小,最常用的统计量是标准差(sta ndard deviatio n).标准差是样本数据到平均数的一种平均距离,一般用s表示.所谓平均距离”其含义可作如下理解:假设样本数据是X1,X2,,x, X表示这组数据的平均数.Xi到x的距离是|xi- x |(i=1,2,n).于是,样本数据X1,X2,x到X的平均距离”是S=|Xn X|由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差x)2 (X2x)2(Xn X)2.意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定标准差越小 数据的离散程度就越小,也就越稳定从标准差的定义可以看出,

29、标准差s(当 s=0时,意味着所 有的样本数据都等于样本平均数 标准差还可以用于对样本数据的另外一种解释.例如,在关于居民月均用水量的例子中,平均数X =1.973,标准差s=0.868,所以X +s=2.841, X +2s=3.709;X-s=1.105, X -2s=0.237.这100个数据中,在区间X-2s,X+2s = : 0.237,3.709外的只有 4个,也就是说, :X -2s, X +2s几乎包含了所有样本数据.从数学的角度考虑,人们有时用标准差的平方s2方差来代替标准差,作为测量样本数据分散程度的工具:s2=(X1-X )2+(X2-X )2+(Xn-X)2.n显然,在

30、刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般多采用标准差.需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理的,也是可以接受的.两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入中的运动员成绩的标准差的计算器计算.用计算器计算运动员甲的成绩的标准差的过程如下:1 卄讣T I进人统计计讳模)5HI卜t 川Q Q (讷除址计祥欝

31、器)(町目 Q (廿算样44】潇養j2即s甲=2.用类似的方法,可得 s乙 1.095.由s甲s乙可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击 成绩稳定.应用示例思路1例1画出下列四组样本数据的条形图,说明它们的异同点(1) 5,5,5,5,5,5,5,5,5 ;(2) 4,4,4,5,5,5,6,6,6 ;(3) 334,4,5,6,6,7,7 ;(4) 2,2,225,8,8,8,8.分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即 可算出每一组数据的标准差解:四组样本数据的条形图如下:w0.9O.K (L- 0.6 0.5

32、 Il 4 03 0.20.1举 n9.8_7fc6.54Jl; (.r().lk()_仇。eon.n u4 5 h 71.49四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的 .例2甲、乙两人同时生产内径为25.40 mm的一种零件为了对两人的生产质量进行评比从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):甲25.4625.3225.4525.3925.3625.3425.4225.4525.3825.4225.3925.4325.3925.4025.4425.4025.

33、4225.3525.4125.39乙25.4025.4325.4425.4825.4825.4725.4925.4925.3625.3425.3325.4325.4325.3225.4725.3125.3225.3225.3225.48从生产的零件内径的尺寸看,谁生产的质量较高?由于零件的生产标准已经给出分析:每一个工人生产的所有零件的内径尺寸组成一个总体(内径25.40 mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内径标准尺寸25.40 mm的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接 近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样

34、,比较两人的生产质量,只要比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的估计值.解:用计算器计算可得X甲25.401 X乙2劇06;s 甲 0.037,$乙 0.068.从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40 mm),但是差异很小;从样本标准差看,由于s甲s 乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲生产的零件的质量比乙的高一些 .点评:从上述例

35、子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的零件内径(样本数据)直接相关显然,我们可以从这名工人生产的零件中获取许多样本这样,尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变, 这就会影响到我们对总体情况的估计如果样本的代表性差,那么对总体所作出的估计就会产生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大这也正是我们在前面讲随机抽样时反复强调样本代表性的理由在实际操作中,为了减少错误的发生,条件许可时,通常采取适当增加样本容量的方法当然,关键还是要改进抽样方法,提高样本的代表性变式训练某地区全体九年级的 3 000名学生参

36、加了一次科学测试 ,为了估计学生的成绩,从不同学 校的不同程度的学生中抽取了100名学生的成绩如下:100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.请根据以上数据估计该地区3 000名学生的平均分、合格率(60或60分以上均属合格)解:运用计算器计算得:100 12 90 30 80 18 70 24 60 12 50 4=79.40,100(12+30+18+24+12) 100=96%,所以样本的平均分是 79.40分,合格率是96%,由此来估计总体 3 000名学生的平均分是 79.40 分,合格率是96%.思路2例1甲、乙两种水稻试验品种连续5年的平

37、均单位面积产量如下(单位:t/hm2),试根据这组数据估计哪一种水稻品种的产量比较稳定品种第1年第2年第3年第4年第5年甲9.89.910.11010.2乙9.410.310.89.79.8解:甲品种的样本平均数为10,样本方差为(9.8-10) 2 + (9.9-10) 2+ (10.1-10) 2+ (10-10) 2+ (10.2-10) 2弋=0.02.乙品种的样本平均数也为10,样本方差为(9.4-10) 2+ (10.3-10) 2+ (10.8-10) 2+ ( 9.7-10) 2+ (9.8-10) 2弋=0.24.因为0.240.02,所以,由这组数据可以认为甲种水稻的产量比

38、较稳定例2为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.天数151 18181 21211 24241 27271 30301 33331 36361 3900000000灯泡数1111820251672分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.解:各组中值分别为165,195,225,255 , 285,315,345,375,由此算得平均数约为165X1%+195X 11%+225X 18%+255X 20%+285X 25%+315X 16%+345X 7%+375X 2%=267.9无)268(这些组中值的 方差为 X : 1 X165-268)2+11 X195-268) 2+18 X(225-268)2+20 X255-268)2+10025 X285-268) 2+16 X(315-268)2+7 X(345-268) 2+2 X(375-268)2 =2 128.60(天 2).故所求的标准差约-2128.6 -46(天)

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论