




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2用样本估计总体【要点梳理】要点一、总体取值规律的估计(频率分布直方图)频率分布是指一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布..步骤为:(1)计算一组数据中最大值与最小值的差,即求极差⑵决定组距与组数:组距与组数的确定没有具体的标准,一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分为5〜12组.⑶将数据分组(4)列频率分布表⑸画频率分布直方图:其中横轴表示数据,纵轴表示频率与组距的比..意义:频率分布直方图中,每个小矩形的面积表示相应组的频率,所有小矩形的面积的总和等于1..频率分布的估计:频率分布是指各个小组数据在容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.要点诠释:频率分布直方图的特征:.从频率分布直方图可以清楚的看出数据分布的总体趋势.从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有具体数据信息就被抹掉了.当频率分布直方图的组数少,组距大时,容易从中看出数据整体的分布特点,但由于无法看出每组内的数据分布情况,损失了较多的原始数据信息,当频率分布直方图的组数多,组距小时,保留了较多的原始数据信息,但由于场小长方形的较多,有时图形会变的非常不规则,不容易从中看出数据分布的特点4.补充:除频率分布直方图外,我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等,不同的统计图在表示数据上有不同的特点,例如扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势。不同的统计图适用的数据类型也不同,例如条形图适用于描述离散型数据,直方图适用描述连续型数据等。要点二、总体百分位数的估计.概念一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-P)%的数据大于或等于这个值。.步骤可以通过下面的步骤计算一组n个数据的第P百分位数:第一步,按从小到大排列原始数据。第二步,计算i=np%第三步,若i不是整数,而大于i的比邻整数为j,则第p百分位数是j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数。.四分位数我们在初中学过的中位数相当于第50百分位数,在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数,这三个分数把一组从小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也成为第一四分位数和下四分位数,第75百分位数也成为第三四分位数和上四分位数等。要点四、总体集中趋势的估计(众数、中位数与平均数).众数一组数据中出现次数最多的数据叫做众数.如果变量是分类的,用众数是很有必要的.例如班委会要作出一项决定,考察全班同学对它赞成与否就可以用众数..中位数将一组数据从小到大依次排列,把中间数据(或中间两数据的平均数)叫做中位数.中位数把样本数据分成了相同数目的两部分..平均数/ 、样本数据的算术平均数,即X=-(X+X+••-+X).n1 2n要点诠释:.由于众数仅能刻画某一数据出现的次数较多,中位数对极端值不敏感,而平均数又受极端值左右,因此这些因素制约了仅依赖这些数字特征来估计总体数字特征的准确性.一般地,对数值型数据(如用水量,身高,收入,产量等)集中趋势的描述可以用平均数、中位数;而对分类型数据(如校服规格、性别、产品质量等级等)集中趋势的描述可以用众数。
要点四、总体离散程度的估计(标准差与方差)1.方差:S”)[一厂上12.标准差:2.标准差:S=n工(河-E:=113.在实际问题中,总体平均数和总体标准差都是未知的,就像用样本平均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准差,在随机抽样中,样本标准差依赖于样本的选取,具有随机性。要点诠释:.标准差刻画了数据的离散程度和波动幅度,标准差越大,数据的离散程度越大,标准差越小,数据的离散程度越小。.在刻画样本数据的分散程度上,方差和标准差是一样的,但在解决实际问题时,一般多采用标准差【典型例题】类型一:频率分布表、频率分布直方图例1.(1)为了帮助班上的两名贫困生解决经济困难,班上的20名同学捐出了自己的零花钱,他们的捐款数(单位:元)如下:19,20,25,30,24,23,25,29,27,27,28,28,26,27,21,30,20,19,22,20.班主任老师准备将这组数据制成频率分布直方图,以表彰他们的爱心.制图时先计算最大值与最小值的差是 ,若取组距为2,则应分成 组;若第一组的起点定为18.5,则在[26.5,28.5)内的频数为.(2)将容量为100的某个样本数据拆分为10组,若前七组的频率之和为0.79,而剩下的三组中频率依次相差0.05,则剩下的三组中频率最大的一组的频率为 .【答案】(1)1165 (2)0.12【解析】(1)由题意知,极差为30—19=11;由于组距为2,则115.5不是整数,所以取6组;捐款数落在[26.5,28.5)内的有27,27,28,28,27共5个,因此频数为5.(2)设剩下的三组中频率最大的一组的频率为x,则另两组的频率分别为x—0.05,x—0.1.因为频率总和为1,所以有0.79+(x—0.05)+(x—0.1)+x=1,解得x=0.12,所以应填0.12.【总结升华】此类题主要考查在应用频率分布来估计总体的过程中的相关计算问题,其中常用到的就
是样本频率的计算:频率二频数还要注意此公式的一些变形应用.是样本频率的计算:频率二频数还要注意此公式的一些变形应用.【变式1】如图是一容量为100的样本的频率分布直方图,试根据图形中的数据填空.(1)样本数据落在[6,10)内的频率为;(2)样本数据落在[10,14)内的频数为.答案:0.32,0.36例2.对某电子元件进行寿命追踪调查,情况如下:寿命/h100〜200200〜300300〜400400〜500500〜600个数2030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计该电子元件寿命在100〜400h以内的占总体的比例;(4)估计该电子元件寿命在400h以上的在总体中占的比例.【解析】(1)样本频率分布表如下:寿命/h频数频率100〜200200.10200〜300300.15300〜400800.40400〜500400.20500〜600300.15合计2001(2)频率分布直方图如下图所示;4蚯1组距0.0050.004k 0.0030.002 f—।O§向甲岑奇,寿命布(3)估计该电子元件寿命在100〜400h以内占总体的比例为65%;(4)估计该电子元件寿命在400h以上的在总体中占的比例为35%.
【总结升华】本题主要考查对频率分布直方图的理解,只有熟悉它的特征,才能清楚数据分布的总体趋势,根据直方图反映的信息正确解题.学生在理解频率分布直方图时,纵向坐标易错,往往理解成频率,而应该是频率/组距.举一反三:【变式1】一个容量为20的样本,分组后,组距与频数如下[10,20],2;(20,30],3;(30,40],4;(40,50],5;(50,60],4;(60,70],2,则样本在(一8,50]上的频率为(DD.7101D.710A20【解析】根据频率的计算公式频率=频数样本容量求解.频率根据频率的计算公式频率=频数样本容量求解.频率二14207=10,故选D【变式2】某中学为了解学生数学课程的学习情况,在3000名学生中随机抽取200名,并统计这200名学生的某次数学考试成绩,得到了样本的频率分布直方图(如下图所示).根据频率分布直方图推测,这3000名学生在该次数学考试中成绩小于60分的学生数是 .答案:600【变式3】在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如下图所示)已知从左到右各长方形的高的比为2:3:4:6:4:1,第三组的频数为12,请解答下列问题:I~I~ r一一O16II1621我31日舞(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多?有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?
【解析】(1)依题意知第三组的频率为c-4,…=1.•・•第三组的频数为12,2+3+4+6+4+15,一一一,一12…二18(件).・•・本次活动的参评作品数为1二18(件).(2)根据频率分布直方图,可以看出第四组上交的作品数量最多,共有60(3)第四组的获奖率是10=5,第六组上交的作品数量为60x18926・•・第六组的获奖率为§=§.显然第六组的获奖率较高.类型二:总体百分位数的估计例3,一组数据12,34,15,24,39,25,31,48,32,36,36,37,42,50的第25,75百分位数分别为解析:把数据从小到大排序为12/5,24,2531,32,34,36,36,37.39,42邓别共14个数,14X25%=3.5,14X75%=10.5,所以第25.75百分位数分别是第4』1项数据,即分别是25户弧举一反三:【变式1】一组数据为6,47,49,15,42,41,7,43,40,36,则这组数据的下四分位数是(D)A.47 B.49 C.7 D.15解析:从小到大排列,一共11项,下四分位数即第25百分位数,由11x25%=2.75,得下四分位数是第3项,数据为15.【变式2]据的第HSIi分'数为毕业生起始月薪毕业生起始月薪12850-7289()229508313033050g294042R80轴332552755112920【答案】313062710122网)例4,2019年学期末,某学校对100间学生公寓进行综合评比,依考核分数分为A,B,C,D四种等级,其中分数在[60,70)为D等级,有15间;分数在[70,80)为C等级,有40间;分数在[80,90)为B等级,有20间;分数在[90,100)为D等级,有25间.考核评估后,得其频率直方图如图所示,估计
这100间学生公寓评估得分的80%分位数是修率尚距0.040 0.025 0.020 ol&0708090100解析:由直方图可知,[60,70)频率0.15;分数在[70,80)频率为0.4,分数在[80,90)为0.2,其和0.8-0.7590+10X =92为0.75。故可知80%分位数在[90,100)之间。 --0.75 ,所以答案为92.【总结升华】在某些情况下,我们只能获得整理好的统计表和统计图,与原始数据相比,他们损失了一些信息。例如上题我们知道在[90,100)有25个数据,但不知道这25个数据具体是多少,此时我们通常把他们看成均匀地分布在此区间上举一反三:【变式1】随着社会的发展,食品安全问题渐渐成为社会关注的热点,为了提高学生的食品安全意识,某学校组织全校学生参加食品安全知识竞赛,成绩的频率分布直方图如图所示,数据的分组依次为[20,40),[40,60),[60,80),[80,100),估计本班学生的食品安全知识竞赛成绩的第90百分位数是,0.2,0.2,0.4,0.3前三组和为0.7前三组和为0.7,所以第90百分位数在[80,0.9-C.780-F20X =93100),为 :一。类型三:众数、中位数、平均数例5.在一次歌手大奖赛中,6位评委现场给每位歌手评分,然后去掉一个最高分和一个最低分,其余分数的平均数作为该歌手的成绩,已知6位评委给某位歌手的评分是:9.2,9.5,9.4,9.6,9.8,9.5.求这位歌手的得分及6位评委评分的众数和中位数.【答案】9.59.5 9.5【解析】(1)该歌手得分为I=1x(9.5+9.4+9.5+9.6)=9.5.4(2)9.5在这组数据中出现2次,出现次数最多,故评委评分的众数是9.5.(3)将这组数据按从小到大顺序排列后最中间的两个数都是9.5,故中位数是9.5.举一反三:【变式1】某射击手打靶10次,所中环数分别为7,8,7,9,9,9,10,6,9,5.求下列各特征数并加以解释:(1)众数;(2)中位数;(3)平均数.【解析(1)众数是9.众数是9,这说明该射击手每次射击射中9环的可能性较大.(2)将10个数据按小到大的顺序排列有5,6,7,7,8,9,9,9,9,l0.中位数是与上=8.5.中位数是8.5,这说明该射击手每次射击以8.5环为等分线,即射中0〜8环和9〜10环的可能性大体上相当.7+8+7+9+9+9+10+6+9+5(3)平均数是x= =7.9.平均数是7.9,这说明该射击手每次射出的水平近似于8环.例6.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2:4:17:15:9:3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?⑵若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?(3)在这次测试中,学生跳绳次数的中位数落在哪个小组内?请说明理由.频频率/组距90 100110120130140150次数【答案】(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:42+4+17+15+因此第二小组的频率为:42+4+17+15+9+3=0.08又因为频率=第二小组频数
样本容量所以样本容量二第二小组频数第二小组频率12
0.08二150⑵由图可估计该学校高一学生的达标率约为17+15+9+32+4+17+15+9+3x100%=88%⑶由已知可得各小组的频数依次为6,12,51,45,27,9,所以前三组的频数之和为69,前四组的频数之和为114,所以跳绳次数的中位数落在第四小组内.【总结升华】在频率分布直方图中,各小长方形的面积等于相应各组的频率,小长方形的高与频数成正比,各组频数之和等于样本容量,频率之和等于1.类型四:方差、标准差例7.甲、乙两台机床在相同的技术条件下,同时生产一种零件,现在从中抽测10个,它们的尺寸分别如下(单位:mm)甲机床:10.2 10.1 10.0 9.8 9.9 10.3 9.7 10.0 9.9 10.1乙机床:10.3 10.4 9.6 9.9 10.1 10.9 8.9 9.7 10.2 10.0分别计算上面两个样本的平均数和方差.如图纸规定零件的尺寸为10mm,从计算的结果来看哪台机床加工这种零件较合适?【思路点拨】先分析甲、乙机床的平均数,若平均数基本接近,再考虑两机床的稳定程度【解析】— 1, 、 1 - 1 1一一x田二(10.2+10.1+…10.1)=—x100=10,x7=(10.3+10.4+…+10)=—x10=10.甲10 10 乙10 10...s2=—[10.2—10)2+(10.1-10)2+…(10.1-10)2]=0.03mm2甲10s2=—[10.3-10”+(10.4-10”+…(10-10)21=0.06mm2....s甲<s:乙10 甲乙・••用甲机床比乙机床稳定,即用甲机床加工较合适.举一反三:【变式1】甲、乙两台机床同时加工直径为100cm的零件,为了检验质量,各从中抽取6件进行测量,分别记录数据为:甲:9910098 100100103乙:9910010299100100
分别计算两组数据的平均数及方差;根据计算结果判断哪台机床加工零件的质量更稳定.分别计算两组数据的平均数及方差;根据计算结果判断哪台机床加工零件的质量更稳定.【答案】【解析】7【答案】【解析】(1)100,100;3,1(2)乙TOC\o"1-5"\h\z\o"CurrentDocument"— 1 — 1\o"CurrentDocument"X田=-(99+100+98+100+100+103)=100,%=—(99+100+102+99+100+100)=100,甲6 乙6S2=-[(99—100)2+(100—100)2+(98—100)2+(100—100)2+(100—100)2+(103—100)2]二一,甲6 31S2=-[(99—100)2+(100—100)2+(102—100)2+(99—100)2+(100—100)2+(100—100)2]=1.乙6(2)两台机床所加工零件的直径的平均数相同,又s甲>母,所以乙机床加工零件的质量更稳定.例8.在一次科技知识竞赛中,两组学生的成绩如下表:分数5060708090100人数甲组251013146乙组441621212已经算得两个组的平均分都是80分.请根据你所学过的统计知识,进一步判断这两个组在这次竞赛中的成绩谁优谁劣,并说明理由.【解析】(1)甲组成绩的众数为90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.1s甲=2+5+10+13+14+6已仃。—80)2+5(60—80)2+10(70—80)2+13(80—80)2+14(90—80)2+6(100—180)2]=50(2X900+5X400+10X100+13X0+14X100+6X400)=172,1s2=—(4X900+4X400+16—100+2X0+12X100+12X400)=256.As2<s2,乙50 ,甲乙A甲组成绩较乙组成绩稳定,故甲组成绩好些.(3)甲、乙两组成绩的中位数、平均数都是80分,其中,甲组成绩在80分以上的有33人,乙组成绩在80分以上的有26人,从这一角度看,甲组的成绩总体较好.(4)从成绩统计表看,甲组成绩大于或等于90分的人数为14+6=20(人),乙组成绩大于或等于90分的人数为12+12=24(人),A乙组成绩集中在高分段的人数较多,同时,乙组得满分的人数比甲组得满分的人数多6人,从这一角度看,乙组的成绩较好【总结升华】要正确解答这道题,首先要抓住问题中的关键词语.全方位地进行必要的计算,而不能习惯地仅从样本方差的大小去决定哪一组的成绩好,像这样的实际问题还得从实际的角度去分析,如本例10
的“满分人数”;其次要在恰当地评估后,组织好正确的语言作出结论.【巩固练习】.下列关于“样本数据的频率分布表、频率分布直方图”的叙述中正确的是(C)A.从频率分布表可以看出样本数据的平均数B.频数是指落在各个小组内的数据C.每小组的频数与样本容量之比是这个小组的频率D.组数是样本平均数除以组距【解析】A数据的频率分布表一般不能反映原有数据的全部信息。B频数是指落在各个小组内的数据的个数。D组数是极差除以组距。.频率分布直方图中小长方形的面积等于(B)A.组距B.频率C.组数D.频数.一个容量为80的样本中,数据的最大值时140,最小值是50,组距是10,则应将样本数据分为(B)A.10组B.9组 C.8组 D.7组【解析】组数【解析】组数二极大值-极小值
组距.能反映一组数据的离散程度的是(C)A.众数 B.平均数 C.标准差 D.极差.下列数字特征一定是数据组中数据的是(A)A.众数 B.中位数 C.标准差 D.平均数.两个样本,甲:5,4,3,2,1;乙:4,0,2,1,-2。那么样本甲和样本乙的波动大小情况是(C)A.甲、乙波动大小一样A.甲、乙波动大小一样B.甲的波动比乙的波动大C.乙的波动比甲的波动大C.乙的波动比甲的波动大D.甲、乙的波动大小无法比较.数据-2巴,…,4的方差为02,则数据2a/2a2,2匕,…,2%的方差为(C)A.吧 B.。2 C.202 D.4022【解析】O2=1Z(X—X)2,1Z(2X—2X)2=4-1Z(X—X)2=402,ni n i nii=1 i=1 i=1.某商场在国庆黄金周的促销活动中,对10月2日9时至14时的销售额进行统计,其频率分布直方图如下图所示.已知9时至10时的销售额为2.5万元,则11时至12时的销售额为(C).11
A.6万元B.8万元C.10万元 D.12万元【解析】要解答本题,首先就要看懂频率分布图,能从图中得到相应的数据,设11时至12时的销售额为x万元,因为9时至10时的销售额为2.5万元,依题意得01=25,得x=10.0.4x.从某校随机抽取100名学生,获得了他们一周课外阅读时间(单位:小时)的数据,整理得到数据分组及频数分布表和频率分布直方图,估计本校学生一周课外阅读时间第90百分位数是_12―排号分组频数1[0,2)62[2,4)83[4,6)174[6,8)225[8,10)256[10,12)127[12,14)68[14,16)29[16,18)2合计100.观察新生婴儿的体重,其频率分布直方图如图所示,则新生婴儿体重在 (2700,3000]的频率为0.3 .12
Cl.DOlICl.DOlI【解析】频率/组距=0.001,组距=300,频率=0.001X300=0.3..数据a『a2M3,…,an的方差为。2,平均数为r,则⑴数据勺+bk2+bka3+b,…,kan+b,(kb00)的标准差为 ,平均数为 TOC\o"1-5"\h\z⑵数据k(4+b),k(a2+b),k(a3+b),...,k(a+b),(kb丰0)的标准差为,平均数为 ,【答案】⑴|k|o
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 保安劳务用工合同标准文本
- 个人房屋质押合同标准文本
- 买卖工厂废料合同样本样本
- 个人代运营合同标准文本
- 个人押车合同标准文本
- 事业单位务工合同标准文本
- 业务员合同标准文本
- 产品订购意向合同标准文本
- 修复合同标准文本
- 二建培训合同标准文本
- 山东省《山东省仿古建筑工程消耗量定额》交底培训资料
- 鲁迅《祝福》(公开课)省公开课一等奖全国示范课微课金奖
- 2024年长江工程职业技术学院单招职业技能测试题库及答案解析
- RFJ 006-2021 RFP型人防过滤吸收器制造与验收规范(暂行)
- JTG∕T F30-2014 公路水泥混凝土路面施工技术细则
- 加油站安全巡检检查
- 植物生理学课件(王小菁-第8版)-第五章-植物同化物的运输
- 《国家综合性消防救援队伍处分条令(试行)》知识考试题库(含答案)
- 吉林油田公司管理手册
- 个人简历电子版表格下载
- 甲状腺炎-桥本氏甲状腺炎
评论
0/150
提交评论