估计总体的分布_第1页
估计总体的分布_第2页
估计总体的分布_第3页
估计总体的分布_第4页
估计总体的分布_第5页
已阅读5页,还剩38页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 北师大版必修北师大版必修3 3第一章第一章 统计统计5 用样本估计总体用样本估计总体 5.1 估计总体的分布估计总体的分布11 1、学会用样本的频率分布估计总体、学会用样本的频率分布估计总体. .2 2、会根据样本数据画出频率分布直方图及频、会根据样本数据画出频率分布直方图及频率分布折线图率分布折线图. .21.1.什么叫平均数?有什么意义?什么叫平均数?有什么意义?2.2.什么叫中位数?有什么意义?什么叫中位数?有什么意义?3.3.什么叫众数?有什么意义?什么叫众数?有什么意义?4.4.什么叫极差?有什么意义?什么叫极差?有什么意义?5.5.什么叫方差?有什么意义?什么叫方差?有什么意义?

2、6.6.什么叫标准差?有什么意义?什么叫标准差?有什么意义?复习复习3平均数、中位数、众数、极差、方差、标准差平均数、中位数、众数、极差、方差、标准差奇数奇数个数时,中位数有个数时,中位数有1个个;偶数偶数个数时,中位数有个数时,中位数有2个个注:注:中位数可能在所给数据中中位数可能在所给数据中,也可能不在所给数据中也可能不在所给数据中4标准差越大离散程度越大,数据较分散,稳定性就越差;标准差越大离散程度越大,数据较分散,稳定性就越差;标准差越小离散程度越小,数据较集中在平均数周围,标准差越小离散程度越小,数据较集中在平均数周围,稳定性就越好稳定性就越好.5的平均数为的平均数为 ,12,nax

3、 axaxax(2)新数据)新数据方差为方差为 22a s,方差仍为,方差仍为 12,nxb xbxbxb2s(1)新数据)新数据的平均数为的平均数为,方差为,方差为 12,naxb axbaxbaxb22a s的平均数为的平均数为(3)新数据)新数据12,nx xxx2s如果数据如果数据的平均数为的平均数为 ,方差为方差为,则,则方差的运算性质:方差的运算性质:6(2)标准差标准差:我们把数据的方差的算术:我们把数据的方差的算术平方根叫做这组数据的标准差,它也是一平方根叫做这组数据的标准差,它也是一个用来衡量一组数据的波动大小的重要的个用来衡量一组数据的波动大小的重要的量。量。222121(

4、)()() nsxxxxxxn7S3 算出算出 (i=1,2,n););2()ixxS4 算出算出 (i=1,2,n)这)这n个个数的平均数,即为样本方差数的平均数,即为样本方差s2;2()ixxS5 算出方差的算术平方根,即为样本标算出方差的算术平方根,即为样本标准差准差s。计算标准差的计算方法:计算标准差的计算方法:(以下五步)(以下五步) S2 算出每个样本数据与样本平均数的差算出每个样本数据与样本平均数的差 (i=1,2,n););ixxS1 算出样本数据的平均数算出样本数据的平均数x;8 如何通过样本来估计总体的分布情况呢?如何通过样本来估计总体的分布情况呢?这就需要我们先将样本的分

5、布情况表示出来这就需要我们先将样本的分布情况表示出来.l 从前面的分析可以知道,当研究一个对象时,从前面的分析可以知道,当研究一个对象时,如果能得到它们的全部数据(可以看作是总体),如果能得到它们的全部数据(可以看作是总体),我们就可以直接从中分析总体的各种信息我们就可以直接从中分析总体的各种信息.如人口如人口普查得到的数据较为全面,从中可以很好地反映普查得到的数据较为全面,从中可以很好地反映对象的重要信息对象的重要信息. l 但是,在实际问题中,总体的信息往往不能但是,在实际问题中,总体的信息往往不能全部得到,因此我们需要进行抽样调查,从总体全部得到,因此我们需要进行抽样调查,从总体中抽取一

6、部分作为样本,并用样本的各种信息来中抽取一部分作为样本,并用样本的各种信息来估计总体的情况,包括它的分布和基本数字特征估计总体的情况,包括它的分布和基本数字特征.9例例 18951895年,在英国伦敦有年,在英国伦敦有106106块男性头盖骨被挖掘出块男性头盖骨被挖掘出. .经经考证,这些头盖骨的主人死于考证,这些头盖骨的主人死于1665166516661666年之间的大瘟疫年之间的大瘟疫. .人类学家分别测量了这些头盖骨的宽度,数据如下所示人类学家分别测量了这些头盖骨的宽度,数据如下所示(单位:(单位:mmmm),请你估计在),请你估计在1665166516661666年之间,英国男性年之间

7、,英国男性头盖骨宽度的分布情况头盖骨宽度的分布情况. .10解:解:如果把总体看作如果把总体看作是是1665166516661666年之间年之间的英国男性头盖骨的的英国男性头盖骨的宽度,那么我们就是宽度,那么我们就是通过上面挖掘出土得通过上面挖掘出土得到的样本信息,来估到的样本信息,来估计总体的分布情况计总体的分布情况. .但从上面的数据很难但从上面的数据很难直接估计出总体的分直接估计出总体的分布情况,为此,我们布情况,为此,我们可以先将以上数据按可以先将以上数据按每个数据出现的频数每个数据出现的频数和频率汇成表和频率汇成表: :11l从表从表1-6中,我们就能估计出总体大致的分布中,我们就能

8、估计出总体大致的分布情况了,情况了,l如在如在16651666年之间,英国男性头盖骨宽年之间,英国男性头盖骨宽度主要在度主要在136149mm之间,之间,l135mm以下以及以下以及140mm以上所占的比例相以上所占的比例相对较小等对较小等.l但是,这些关于分布情况的描述仍不够形象但是,这些关于分布情况的描述仍不够形象.l为了得到更为直观的信息,我们可以将表中为了得到更为直观的信息,我们可以将表中的数据按照下面的方式分组(如表的数据按照下面的方式分组(如表1-7),),12 当数据在当数据在120120个以内时,通常按照数据的多少分成个以内时,通常按照数据的多少分成5 5到到1212组组. .

9、在实际操作中,一般要求各组的组距相等在实际操作中,一般要求各组的组距相等. . 13l再画频数分布直方图(如图再画频数分布直方图(如图1-23),用图中矩形的),用图中矩形的l高度来反映频数高度来反映频数.50 40 30 20 10 0 120 125 130 135 140 145 150 155 160频数频数宽度宽度/mm图图1-23频数直方图频数直方图14 我们也可以用区间上矩形的面积来反映频率我们也可以用区间上矩形的面积来反映频率, ,得得到下图(图到下图(图1-241-24). .图图1-24频率分布直方图频率分布直方图iixf1550 40 30 20 10 0 120 125

10、 130 135 140 145 150 155 160频数频数宽度宽度/mm图图1-23图图1-24频数直方图频数直方图图图1-24频率分布直方图频率分布直方图iixf16思考:思考:频率分布直方图中,频率分布直方图中,小长方形的面积表示什么?小长方形的面积表示什么?小长方形的面积表示什么?小长方形的面积表示什么?所有小长方形的面积和?所有小长方形的面积和? 小长方形的高小长方形的高组距组距频率频率小长方形的面积表示该组的频率小长方形的面积表示该组的频率所有小长方形的面积和所有小长方形的面积和117讨论讨论(1)头盖骨的宽度位于哪个区间的数据最头盖骨的宽度位于哪个区间的数据最多?多? (2)

11、 头盖骨的宽度位于头盖骨的宽度位于140145 mm的频的频率约是多少?率约是多少?(3) 头盖骨的宽度小于头盖骨的宽度小于140 mm的频率约是的频率约是多少?多少?(4) 头盖骨的宽度位于头盖骨的宽度位于137142 mm的的频率约是多少?频率约是多少?14014543.4%28.3%0.2083/5+0.4342/5=0.298 4,即即29.84% 18l从频率分布表可以看出从频率分布表可以看出:l该样本宽度在该样本宽度在140145mm之间的头盖骨之间的头盖骨所占的频率为所占的频率为l宽度在宽度在137142mm之间的头盖骨所占的之间的头盖骨所占的频率为频率为 ,l由此估计,在由此估

12、计,在16651666年之间,英国男年之间,英国男性头盖骨宽度在性头盖骨宽度在140145mm之间的约为之间的约为l宽度在宽度在137142mm之间的约为之间的约为 .作出估计作出估计l43.4%,29.8%43.4%,29.8%19抽象概括抽象概括从频率分布直方图可以看到,每个频率的值就是该从频率分布直方图可以看到,每个频率的值就是该宽度区间所对对应的频率直方图的面积,图中所有宽度区间所对对应的频率直方图的面积,图中所有小矩形的面积之和,也就是头盖骨的宽度落在各个小矩形的面积之和,也就是头盖骨的宽度落在各个区间内的频率之和等于区间内的频率之和等于1当样本容量较大时,样本中落在每个区间上的当样

13、本容量较大时,样本中落在每个区间上的样本数的频率会样本数的频率会稳定稳定于总体的相应区间内取值于总体的相应区间内取值的的概率概率,因此,我们可以用样本的频率分布去,因此,我们可以用样本的频率分布去估计总体的分布另外,当估计总体的分布另外,当样本量增大样本量增大时,时,用用样本的频率分布去估计总体的分布就越样本的频率分布去估计总体的分布就越精确精确20制作频率直方图的一般步骤:制作频率直方图的一般步骤:1计算极差计算极差2确定组数及组距确定组数及组距3决定分点,适当增大极差决定分点,适当增大极差4列出频率分布表列出频率分布表5绘图绘图211 1、求极差、求极差( (即一组数据中最大值与最小值的差

14、即一组数据中最大值与最小值的差) )2 2、决定组距与组数、决定组距与组数3 3、确定分点,将数据分组、确定分点,将数据分组:.:.画频率分布直方图的步骤:画频率分布直方图的步骤:4 4、列出列出频率分布表频率分布表. .5 5、画出画出频率分布直方图频率分布直方图. .组距组距: :指每个小组的两个端点的距离指每个小组的两个端点的距离. .组数:组数:将数据分组,当数据在将数据分组,当数据在1 12020个以内时,按数个以内时,按数据多少常分据多少常分5-125-12组组. .22在频率直方图中,按照分组原则,再在左右两边各加在频率直方图中,按照分组原则,再在左右两边各加一个区间,从所得的各

15、个区间的中点开始,用线段依一个区间,从所得的各个区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为点,就可以得到一条折线,我们称之为频率折线图频率折线图,有时用它来评估总体的分布情况有时用它来评估总体的分布情况23当样本量增大时,为使所得的频率分布当样本量增大时,为使所得的频率分布直方图更好地反映总体的分布情况,我直方图更好地反映总体的分布情况,我们往往将划分的区间数相应增多,每个们往往将划分的区间数相应增多,每个区间的长度则会相应减小,这样得到的区间的长度则会相应减小,这样得到的频率折线图也就

16、会越来越接近于一条频率折线图也就会越来越接近于一条光光滑曲线滑曲线 24当样本量较大时,可以用样本的频率当样本量较大时,可以用样本的频率分布(频率分布表、频率分布直方图、分布(频率分布表、频率分布直方图、频率折线图)来估计总体的分布。频率折线图)来估计总体的分布。当当样本量发生变化时,估计的结果会有哪些样本量发生变化时,估计的结果会有哪些变化变化 ? 课堂讨论课堂讨论一般地,样本容量越大,用样本的频率分一般地,样本容量越大,用样本的频率分布去估计总体的分布就越精确布去估计总体的分布就越精确.25总体分布总体分布样本分布样本分布频数分布表频数分布表频率分布表频率分布表频率直方图频率直方图频率折线

17、图频率折线图26几种表示频率分布的方法的优点和不足:几种表示频率分布的方法的优点和不足:1.频率分布表:频率分布表:反映具体数据在各个不同区反映具体数据在各个不同区间的取值频率,但不够直观、形象,对分析间的取值频率,但不够直观、形象,对分析数据分布的总体态势不太方便。数据分布的总体态势不太方便。2.频率分布直方图:频率分布直方图:能够非常直观的表明数据能够非常直观的表明数据分布的形状,一般是中间高、两端低、左右分布的形状,一般是中间高、两端低、左右对称的对称的峰状结构峰状结构。但是从直观图把原有的具。但是从直观图把原有的具体数据信息就被抹掉了。体数据信息就被抹掉了。273.频率分布折线图:频率

18、分布折线图:反映了数据的变化趋反映了数据的变化趋势,如果样本容量不断增大,分组的组势,如果样本容量不断增大,分组的组距不断缩小,那么折线图就趋向于总体距不断缩小,那么折线图就趋向于总体分布的密度曲线。分布的密度曲线。4.茎叶图:茎叶图:由所有的样本数据组成,没有损由所有的样本数据组成,没有损失任何样本信息,也可以在抽样时随时记录,失任何样本信息,也可以在抽样时随时记录,但在样本数据但在样本数据个数较多个数较多或或位数较多位数较多时就不适时就不适用了,况且只能记录用了,况且只能记录左右左右两组数据,分析也两组数据,分析也比较粗略。比较粗略。28 例题:例题: 我国是世界上严重缺水的国家之一,城市

19、我国是世界上严重缺水的国家之一,城市缺水问题较为突出缺水问题较为突出. .某市政府为了节约用水,计划在本市某市政府为了节约用水,计划在本市试行居民生活用水定额管理条例,即确定一个居民月用试行居民生活用水定额管理条例,即确定一个居民月用水量标准水量标准,用水量不超过用水量不超过 的按平价收费,超过的按平价收费,超过 的按议的按议价收费价收费. .如果希望大部分居民的日常生活不受影响,那么如果希望大部分居民的日常生活不受影响,那么标准标准 定为多少比较合理?你认为为了较为合理地确定出定为多少比较合理?你认为为了较为合理地确定出这个标准,需要做什么工作?这个标准,需要做什么工作?29根据这些数据你根

20、据这些数据你能得出用水量其能得出用水量其他信息吗他信息吗? 由于城市住户较多,通常采用抽样调查的方式,通过分析由于城市住户较多,通常采用抽样调查的方式,通过分析样本数据来估计全市居民用水量的分布情况样本数据来估计全市居民用水量的分布情况. .假设通过抽样,假设通过抽样,我们获得了我们获得了100100位居民某年的月均用水量位居民某年的月均用水量( (单位:单位:t)t):30表表21 100位居民的月均用水量位居民的月均用水量 (单位(单位 :t ) 3.1 2.5 2.0 2.0 1.5 1.0 1.6 1.8 1.9 1.63.4 2.6 2.2 2.2 1.5 1.2 0.2 0.4 0

21、.3 0.43.2 2.7 2.3 2.1 1.6 1.2 3.7 1.5 0.5 3.8 3.3 2.8 2.3 2.2 1.7 1.3 3.6 1.7 0.6 4.13.2 2.9 2.4 2.3 1.8 1.4 3.5 1.9 0.8 4.3 3.0 2.9 2.4 2.4 1.9 1.3 1.4 1.8 0.7 2.0 2.5 2.8 2.3 2.3 1.8 1.3 1.3 1.6 0.9 2.32.6 2.7 2.4 2.1 1.7 1.4 1.2 1.5 0.5 2.42.5 2.6 2.3 2.1 1.6 1.0 1.0 1.7 0.8 2.42.8 2.5 2.2 2.0 1.

22、5 1.0 1.2 1.8 0.6 2.231 从上面这些数字,我们很容易发现居民的月均用水量从上面这些数字,我们很容易发现居民的月均用水量的最小值是的最小值是0.2t,0.2t,最大值是最大值是4.3t.4.3t.其他在其他在0.20.2至至4.34.3之间之间. .很很难再发现其他信息难再发现其他信息. .我们很难从随意记录的数据中直接看我们很难从随意记录的数据中直接看出规律出规律. .为此,我们需要对统计数据进行整理与分析为此,我们需要对统计数据进行整理与分析. .这就用到了我们今天要学习的频率分布直方图这就用到了我们今天要学习的频率分布直方图.321 1、求极差、求极差( (即一组数据

23、中最大值与最小值的差即一组数据中最大值与最小值的差) )知道这组数据的变动范围知道这组数据的变动范围4.3-0.2=4.14.3-0.2=4.1(t t). .2 2、决定组距与组数(将数据分组)、决定组距与组数(将数据分组)3 3、将数据、将数据分组分组.(8.2.(8.2取整取整, ,分为分为9 9组组) )画频率分布直方图的步骤:画频率分布直方图的步骤:4 4、列出列出频率分布表频率分布表. .5 5、画出画出频率分布直方图频率分布直方图. .组距组距: :指每个小组的两个端点的距离指每个小组的两个端点的距离. .组数:组数:将数据分组,当数据在将数据分组,当数据在1 12020个以内时

24、,按数个以内时,按数据多少常分据多少常分5-125-12组组. .4.18.20.5极差组数=组距33注意注意第几组频数(1)第几组频率样本容量(2)(2)纵坐标为纵坐标为: :频 率组 距34 表表22 100位居民月均用水量的位居民月均用水量的 频率分布表频率分布表 分组分组 频数累计频数累计 频数频数 频率频率 0 , 0.5) 4 0.04 0.5 , 1) 8 0.08 1 , 1.5) 15 0.15 1.5 , 2) 22 0.22 2 , 2.5) 25 0.25 2.5 , 3) 14 0.14 3 , 3.5) 6 0.06 3.5 , 4) 4 0.04 4 , 4.5) 2 0.02 合计合计 100 1.0035频率分布直方图频率分布直方图月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5小长方形的面积小长方形的面积=?36月均用水量月均用水量/t频率频率组距组距0.100.200.300.400.500.511.5 22.533.544.5频率分布直方图频率分布直方图各小长方形的面各小长方形的面积总和积总和=?注:小长方形的面积组距注:小长方形的面积组距频率频率/ /组距频率组距

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论