版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
5.1.4用样本估计总体本课时是统计的最后一节内容,本小节以前可以归结为描述统计学的范畴,主要讨论的是数据应该怎么收集、整理、分析。本课时的内容可以归结为推断统计学的范畴,主要讨论的是如何根据样本数据来得到总体的信息,从而为相关的决策提供指导。本小节的教学重点是帮助学生理解样本的数字特征估计总体的数字特征、用样本的分布估计总体的分布的合理性,体会统计思想与确定性思维的差异,通过对用样本估计总体的学习,强化数据分析、数学运算、数学建模的核心素养.考点教学目标核心素养用样本的数字特征估计总体的数字特征掌握利用样本的众数、中位数、平均数、方差估计总体的众数、中位数、平均数、方差数据分析、数学运算、数学建模通过频率分布或频率分布直方图对数据作出总体估计掌握通过样本的频率分布或频率分布直方图对数据作出总体估计数据分析、数学运算、数学建模【教学重点】用样本的数字特征估计总体的数字特征、通过频率分布或频率分布直方图对数据作出总体估计【教学难点】通过频率分布或频率分布直方图对数据作出总体估计问题1.用样本的数字特征估计总体的数字特征一般情况下,如果样本的容量恰当,抽样方法又合理的话,样本的特征能够反映总体的特征。特别地,样本平均数(也称为样本均值)、方差(也成为样本方差)与总体对应地值相差不会太大.例如,上述数据中,如果用简单随机抽样抽得地序号分别为90,35,63,68,66,9,30,56,50,49,则对应地样本为:169,169,163,175,163,170,164,151,155,165,容易算出,样本均值为164.4,样本方差为45.84,它们与总体对应地值差别不大.需要强调的是,估计一般是有误差的,例如,如果总体平均数记为,样本均值记为,一般来说,都有可能。但是,当样本容量越来越大时,估计的误差很小的可能性越来越大。一般来说,在估计总体的数字特征时,只需直接算出样本对应的数字特征即可.问题2:分层抽样下用样本的数字特征估计总体的数字特征假设第一层有个数,分别为,平均数为,方差为;第二层有个数,分别为,平均数为,方差为,则如果记样本均值为,样本方差为,则可以计算出依照上述公式可以算出,前述尝试与发现(2)中总体的平均数可以估计为167.86,总体的方差可以估计为25.98.问题3.用样本的分布估计总体的分布如果从上述尝试与发现中提到的数据中,抽取两个容量为100的样本,则可以得到如下频数、频率对应表:同数字特征的估计一样,分布的估计一般也有误差。如果总体在每一个分组的频率记为:,样本每一组对应的频率为,一般来说,不等于0,同样,当样本的容量越来越大时,上式很小的可能性将越来越大.例1.为了快速了解某学校学生体重(单位:Kg)的大致情况,随机抽取了10名学生称重,得到的数据整理成茎叶图如图所示,估计这个学校学生体重的平均数和方差.解:将样本中的每一个数都减去50,可得-5,-1,-3,-1,-4,-4,1,8,9,10这组数的平均数为:方差为:因此可估计这个学校学生体重的平均数为51,方差为30.4【变式练习】1.某医院急诊中心关于病人等待急诊的时间记录如下:等待时间/min510152021频数18521则病人候诊时间的平均数为________.【答案】13eq\x\to(y)甲=eq\f(1,n)eq\i\su(i=1,n,y)i=eq\f(1,17)(1×5+8×10+5×15+2×20+1×21)=13.2.对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(m/s)如下:甲:27,38,30,37,35,31乙:33,29,38,34,28,36根据以上数据,试判断他们谁的成绩比较稳定.解:eq\x\to(x)甲=eq\f(1,6)×(27+38+30+37+35+31)=33,seq\o\al(2,甲)=eq\f(1,6)×[(27-33)2+(38-33)2+…+(31-33)2]=eq\f(1,6)×94≈15.7,eq\x\to(x)乙=eq\f(1,6)×(33+29+38+34+28+36)=33,seq\o\al(2,乙)=eq\f(1,6)×[(33-33)2+(29-33)2+…+(36-33)2]=eq\f(1,6)×76≈12.7.所以eq\x\to(x)甲=eq\x\to(x)乙,seq\o\al(2,甲)>seq\o\al(2,乙),这说明甲、乙两运动员的最大速度的平均值相同,但乙的成绩比甲的稳定,故乙的成绩比较稳定.【解题方法】在实际问题中,仅靠平均数不能完全反映问题,还要研究其偏离平均值的离散程度(即方差或标准差).方差大说明取值离散程度大,方差小说明取值离散程度小或者取值集中、稳定.,例2.某高校欲了解在校学生用于课外进修(如各种考证辅导班、外语辅导班等)的开支,在全校8000名学生中用分层随机抽样抽出了一个200人的样本,根据学生科的统计,本科生人数为全校学生的70%,调查最近一个学期课外进修支出(元)的结果如下:层样本量样本均值样本方差本科140253.4231研究60329.4367试估计全校学生用于课外进修的平均开支和开支的方差.解.把本科生样本记为x1,x2,…,x140,其平均数记为eq\x\to(x),方差记为seq\o\al(2,x);把研究生记为y1,y2,…,y60,其平均数为eq\x\to(y),方差记为seq\o\al(2,y);把总体数据的平均数记为eq\x\to(z),方差记为s2.则eq\x\to(x)=eq\f(1,140)eq\i\su(i=1,140,x)i,seq\o\al(2,x)=eq\f(1,140)eq\i\su(i=1,140,x)eq\o\al(2,i)-eq\x\to(x)2;eq\x\to(y)=eq\f(1,60)eq\i\su(j=1,60,y)j,seq\o\al(2,y)=eq\f(1,60)eq\i\su(j=1,60,y)eq\o\al(2,j)-eq\x\to(y)2.所以eq\i\su(i=1,140,x)eq\o\al(2,i)=140eq\b\lc\(\rc\)(\a\vs4\al\co1(s\o\al(2,x)+\x\to(x)2)),eq\i\su(j=1,60,y)eq\o\al(2,j)=60eq\b\lc\(\rc\)(\a\vs4\al\co1(s\o\al(2,y)+\o(y,\s\up6(-))2)).总样本平均数为:eq\x\to(z)=eq\f(140,200)×253.4+eq\f(60,200)×329.4=276.2(元)总样本方差为:s2=eq\f(1,200)eq\b\lc\(\rc\)(\a\vs4\al\co1(\i\su(i=1,140,x)\o\al(2,i)+\i\su(j=1,60,y)\o\al(2,j)))-eq\o(z,\s\up6(-))2=eq\f(1,200)eq\b\lc\[\rc\](\a\vs4\al\co1(140\b\lc\(\rc\)(\a\vs4\al\co1(s\o\al(2,x)+\o(x,\s\up6(-))2))+60\b\lc\(\rc\)(\a\vs4\al\co1(s\o\al(2,y)+\o(y,\s\up6(-))2))))-eq\o(z,\s\up6(-))2.=eq\f(1,200)eq\b\lc\[\rc\](\a\vs4\al\co1(140231+253.42+60367+329.42))-276.22=1484.76.由于分层随机抽样是按比例分配的,所以可以估计全校学生用于课外进修的平均开支为276.2元,开支的方差为1484.76.【变式练习】在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和标准差.解把专业人士打分样本记为x1,x2,…,x8,其平均数记为eq\x\to(x),方差记为seq\o\al(2,x);把观众代表打分样本记为y1,y2,…,y12,其平均数为eq\x\to(y),方差记为seq\o\al(2,y);把总体数据的平均数记为eq\x\to(z),方差记为s2则总样本平均数为:eq\x\to(z)=eq\f(8,20)×47.4+eq\f(12,20)×56.2=52.68(分),总样本方差为:s2=eq\f(1,20)[eq\i\su(i=1,8,)(xi-eq\x\to(z))2+eq\i\su(j=1,12,)(yj-eq\x\to(z))2]=eq\f(1,20)eq\b\lc\{\rc\}(\a\vs4\al\co1(8\b\lc\[\rc\](\a\vs4\al\co1(s\o\al(2,x)+\b\lc\(\rc\)(\a\vs4\al\co1(\x\to(x)-\x\to(z)))2))+12[s\o\al(2,y)+\x\to(y)-\x\to(z)2]))=eq\f(1,20)eq\b\lc\{\rc\}(\a\vs4\al\co1(8[3.72+47.4-52.682]+12[11.82+56.2-52.682]))=107.6,总样本标准差s≈10.37.所以计算这名选手得分的平均数为52.68分,标准差约为10.37.【解题方法】1.计算样本平均数、样本方差直接利用公式,注意公式的变形,样本方差s2=eq\f(1,n)eq\i\su(i=1,n,)eq\b\lc\(\rc\)(\a\vs4\al\co1(xi-\x\to(x)))2=eq\f(1,n)eq\i\su(i=1,n,x)eq\o\al(2,i)-eq\o(x,\s\up6(-))2.2.在按比例分配分层随机抽样中,我们可以用样本平均数和样本方差估计总体平均数和总体方差.例3.我们是世界上严重缺水的国家之一,某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位,t),将数据按照分层5组,支撑了如图所示的频率分布直方图.(1)求图中的a的值;(2)设该市有10万个家庭,估计全市月均用水量不低于3t的家庭数;(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.解:(1)因为频率分布直方图所有矩形的面积之和为1,所以 解得:(2)抽取的样本中,月均用水量不低于3t的家庭所占比例为因此估计全市月均用水量不低于3t的家庭所占比例也为30%,所求家庭数位100000.(3)因为因此估计全市家庭月均用水量的平均数位2.46.【变式练习】某校从参加高二年级学业水平测试的学生中抽出80名学生,其数学成绩(均为整数)的频率分布直方图如图所示.(1)求这次测试数学成绩的众数;(2)求这次测试数学成绩的中位数(3)求这次测试数学成绩的平均分.(4)试估计80分以上的学生人数.解(1)由图知众数为eq\f(70+80,2)=75.(2)由图知,设中位数为x,由于前三个矩形面积之和为0.4,第四个矩形面积为0.3,0.3+0.4>0.5,因此中位数位于第四个矩形内,得0.1=0.03(x-70),所以x≈73.3.(3)由图知这次数学成绩的平均分为:eq\f(40+50,2)×0.005×10+eq\f(50+60,2)×0.015×10+eq\f(60+70,2)×0.02×10+eq\f(70+80,2)×0.03×10+eq\f(80+90,2)×0.025×10+eq\f(90+100,2)×0.005×10=72.(4)[80,90)分的频率为:0.025×10=0.25,频数为:0.25×80=20.[90,100]分的频率为:0.005×10=0.05,频数为:0.05×80=4.所以估计80分以上的学生人数为20+4=24.【解题方法】1.众数、中位数、平均数与频率分布表、频率分布直方图的关系(1)众数:众数一般用频率分布表中频率最高的一小组的组中值来表示,即在样本数据的频率分布直方图中,最高矩形的底边中点的横坐标.(2)中位数:在频率分布表中,中位数是累计频率(样本数据小于某一数值的频率叫作该数值点的累计频率)为0.5时所对应的样本数据的值,而在样本中有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等.(3)平均数:平均数在频率分布直方图中等于每个小矩形底边中点的横坐标与小矩形的面积的乘积之和.又平均数是频率分布直方图的“重心”.2.利用直方图求众数、中位数、平均数均为近似值,往往与实际数据得出的不一致,但它们能粗略估计其众数、
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 扁腺手术前后护理
- 幼儿园食堂承包合同范本
- 腮腺肿瘤护理查房教案
- 管理员劳动合同大全
- 《皮肤粘膜淋》课件
- 小学教师校本培训
- 混合痔的术后护理
- 手术缝针管理
- 腹腔镜手术安全管理
- 新建万年表石材项目立项申请报告
- 桩基旋挖钻干孔扩底桩施工方案
- 高三一轮复习三角函数的图像与性质
- 创造突破性产品课件
- 《脑小血管病》课件
- 电动车新国标课件
- 广西壮族自治区百色市各县区乡镇行政村村庄村名明细及行政区划划分代码居民村民委员会
- 中医适宜技术十五项
- 二年级上册科学课件 - 《4.神奇的纸》教科版 (共16张PPT)
- 针刀治疗扳机指的解剖学基础
- PDC钻头设计课件解读
- 苏教版四年级上册数学第七单元整数四则混合运算试卷【含答案】
评论
0/150
提交评论