用样本的频率分布表和频率分布图估计总体分布_第1页
用样本的频率分布表和频率分布图估计总体分布_第2页
用样本的频率分布表和频率分布图估计总体分布_第3页
用样本的频率分布表和频率分布图估计总体分布_第4页
用样本的频率分布表和频率分布图估计总体分布_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、用样本的用样本的频率分布频率分布估计总体分布估计总体分布( (一一) ) 1.不易知一个总体的分布情况时,往往从总体中不易知一个总体的分布情况时,往往从总体中抽取一个样本,用样本的频率分布去估计总体的抽取一个样本,用样本的频率分布去估计总体的频率分布,样本容量越大,估计就越精确频率分布,样本容量越大,估计就越精确. .2. 2. 目前有:目前有:频率分布表、直方图、茎叶图频率分布表、直方图、茎叶图. .3.3.当总体中的个体取值很少时,用茎叶图估计总当总体中的个体取值很少时,用茎叶图估计总体的分布;当总体中的个体取值较多时,将样本体的分布;当总体中的个体取值较多时,将样本数据恰当分组,用各组的

2、频率分布描述总体的分数据恰当分组,用各组的频率分布描述总体的分布,方法是用频率分布表或频率分布直方图。布,方法是用频率分布表或频率分布直方图。频率分布直方图有哪几个步骤频率分布直方图有哪几个步骤 第一步第一步: 求极差求极差: 第二步第二步: 决定组距与组数决定组距与组数: 第三步第三步: 将数据分组将数据分组 第四步第四步: 列频率分布表列频率分布表. 第五步第五步: 画频率分布直方图画频率分布直方图 频率分布直方图频率分布直方图(1 1)含义:)含义:表示样本数据分布规律的图表示样本数据分布规律的图形形. .(2 2)作法:)作法:第一步,画平面直角坐标系第一步,画平面直角坐标系. .第二

3、步,在横轴上均匀标出各组分点,第二步,在横轴上均匀标出各组分点,在纵轴上标出单位长度在纵轴上标出单位长度. .第三步,以组距为宽,各组的频率与组第三步,以组距为宽,各组的频率与组距的商为高,分别画出各组对应的小长距的商为高,分别画出各组对应的小长方形方形. . 一般地,样本容量越大,这种估计就越精确。总体估计要掌握:(1)“表”(频率分布表);(2)“图”(频率分布直方图)。提醒提醒:直方图的纵轴(小矩形的高)一般是频率除以组距的商(而不是频率),横轴一般是数据的大小,小矩形的面积表示频率小矩形的面积表示频率。课本例1和题组集训1(一)频率分布折线图:(一)频率分布折线图: 画好频率分布直方图

4、后,我们把频率分布直方画好频率分布直方图后,我们把频率分布直方图中各小长方形上端连接起来,得到的图形。图中各小长方形上端连接起来,得到的图形。. .00.10.20.30.40.50.6 0.5 1 1.5 2 2.5 3 3.5 4 4.5频率频率/组距组距 月均用水量月均用水量/t (取组距中点取组距中点, 并连线并连线 ) 0.080.160.30.440.50.280.120.080.04 在样本频率分布直方图中,当样本容量增加,作图在样本频率分布直方图中,当样本容量增加,作图时所分的组数增加,组距减少,相应的频率折线图会越时所分的组数增加,组距减少,相应的频率折线图会越来越接近于一条

5、光滑曲线,统计中称这条光滑曲线为来越接近于一条光滑曲线,统计中称这条光滑曲线为总总体密度曲线体密度曲线. . 它能够精确地反映了总体在各个范围内取它能够精确地反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息值的百分比,它能给我们提供更加精细的信息. 总体密度曲线:总体密度曲线:月均用水量月均用水量/t/t频率频率组距组距0ab(二)茎叶图(二)茎叶图( (一种被用来表示数据的图一种被用来表示数据的图) ) 当数据是两位有效数字时,用中间的数字当数据是两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有

6、效数字,它的中间部表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做叶子,因此通常把这样的图叫做茎叶图茎叶图 。例例: : 某赛季甲乙两名篮球运动员比赛得分记录如下:某赛季甲乙两名篮球运动员比赛得分记录如下:甲:甲:13, 51, 23, 8, 26, 38, 16, 33, 14, 28, 3913, 51, 23, 8, 26, 38, 16, 33, 14, 28, 39乙:乙:49, 24, 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 3949, 24,

7、 12, 31, 50, 31, 44, 36, 15, 37, 25, 36, 39用茎叶图表示两人成绩,说明哪一个成绩好用茎叶图表示两人成绩,说明哪一个成绩好甲甲乙乙0 12345 2, 55, 41, 6, 1, 6, 7, 9 4, 90 8 4, 6, 3 3, 6, 8 3, 8, 9 1 叶叶 茎茎 叶叶画茎叶图的步骤画茎叶图的步骤: :1.将每个数据分为茎将每个数据分为茎(高位高位)和叶和叶(低位低位)两部分两部分,在此例中在此例中,茎茎为十位上的数字为十位上的数字,叶为个位上的数字叶为个位上的数字;2.将最小茎和最大茎之间的数按大小次序排成一列将最小茎和最大茎之间的数按大小次

8、序排成一列,写在写在左左(右右)侧侧;3.将各个数据的叶按大小次序写在其茎右将各个数据的叶按大小次序写在其茎右(左左)侧侧.茎叶图的特征:茎叶图的特征:()用茎叶图表示数据有两个优点:一没有原始数据信()用茎叶图表示数据有两个优点:一没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二数据息的损失,所有数据信息都可以从茎叶图中得到;二数据可以随时记录,随时添加,方便记录与表示。可以随时记录,随时添加,方便记录与表示。()茎叶图只便于表示两位有效数字的数据,而且茎叶()茎叶图只便于表示两位有效数字的数据,而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,图只方便记录两组的数据,

9、两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰。但是没有表示两个记录那么直观,清晰。练习:对于样本数据:练习:对于样本数据:3.13.1,2.5,2.02.5,2.0,0.80.8,1.51.5,1.01.0,4.34.3,2.72.7,3.13.1,3.53.5,用茎叶图如何表示?,用茎叶图如何表示? 0123480 50 5 71 1 53茎茎叶叶怎样将各个样本数据汇怎样将各个样本数据汇总为一个数值总为一个数值,并使它成并使它成为样本数据的中心点为样本数据的中心点?能否用一个数值来描写能否用一个数值来描写样本数据的离散程度样本数据的离散程度?用样本的数字特征用样本的数字特征

10、估计总体的数字特征估计总体的数字特征2初中学过的众数、中位数、平均初中学过的众数、中位数、平均数,其定义分别是数,其定义分别是(1)在一组数据中在一组数据中 的数的数据叫做这组数据的众数据叫做这组数据的众数(2)将一组数据按大小顺序依次排列,将一组数据按大小顺序依次排列,把处在把处在 的一个数据的一个数据(或最中或最中间两个数据的平均数间两个数据的平均数)叫做这组数据的中叫做这组数据的中位数位数出现次数最多出现次数最多最中间位置最中间位置 例例: : 在一次中学生田径运动会上,参加男在一次中学生田径运动会上,参加男子跳高的子跳高的17名运动员的成绩如下表所示:名运动员的成绩如下表所示:成绩成绩

11、(单位单位:米米)150160165170175180 185 190人数人数23234111 分别求这些运动员成绩的众数,中位数与分别求这些运动员成绩的众数,中位数与平均数平均数 解:在解:在17个数据中,个数据中,1.75出现了出现了4次,出现的次,出现的次数最多,即这组数据的次数最多,即这组数据的众数众数是是1.75上面表里的上面表里的17个数据可看成是按从小到大个数据可看成是按从小到大的顺序排列的,其中第的顺序排列的,其中第9个数据个数据1.70是最中间是最中间的一个数据,即这组数据的的一个数据,即这组数据的中位数中位数是是1.70;这组数据的这组数据的平均数平均数是是答:答:17名运

12、动员成绩的众数、中位数、平均数名运动员成绩的众数、中位数、平均数依次是依次是1.75(米)、(米)、1.70(米)、(米)、1.69(米)(米). (1.5 2 1.6 31.85 1.9)1.69x 3:一组数据:一组数据1, 2, 8, 4, 3, 9, 5, 4, 5, 4. 那么那么( )A.这组数据的众数是这组数据的众数是4;B.这组数据的中位数是这组数据的中位数是3;C.这组数据的平均数是这组数据的平均数是4;D.以这组数为一个样本以这组数为一个样本,样本容量为样本容量为9.A 两组并列两组并列的情况下的情况下,两两组数都是众数组数都是众数.练练1: 2.3, 2.4, 2.5,

13、2.6, 2.7中的中位数中的中位数 为为 . 2.5 2: 2.3, 2.4, 2.5, 2.6, 2.7, 2.8 中的中的中位数为中位数为 .分析分析: (2.5+ 2.6) 2=2.552.55从居民月均用水量样本数据可知,该样本的从居民月均用水量样本数据可知,该样本的众数是众数是2.3,中位数是中位数是2.0,平均数是,平均数是1.973思考:思考:如何从频率分布直方图中如何从频率分布直方图中读取众数,中位数,平均数读取众数,中位数,平均数?一、在频率分布直方图中读取众数,中位数,平均数一、在频率分布直方图中读取众数,中位数,平均数 1 1、众数在样本数据的频率分布直方图中,就是最高

14、、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标矩形的中点的横坐标. . 例如,在上一节调例如,在上一节调查的查的100位居民的位居民的月均用水量的问题月均用水量的问题中,从这些样本数中,从这些样本数据的频率分布直方据的频率分布直方图可以看出,月均图可以看出,月均用水量的众数用水量的众数是是 .如图所示如图所示:频率频率组距组距0.10.20.30.40.5O 0.5 1 1.5 2 2.5 3 3.5 4 4.5 月平均用水量月平均用水量(t)2.25t图中虚线代表居民图中虚线代表居民月均用水量的中位月均用水量的中位数的估计值,此数数的估计值,此数据值为据值为 . 2.在样本中

15、,有在样本中,有50%的个体小于或等于中位的个体小于或等于中位数,也有数,也有50%的个体大于或等于中位数因此,的个体大于或等于中位数因此,在频率分布直方图中,中位数左边和右边的直方在频率分布直方图中,中位数左边和右边的直方图的面积应该图的面积应该 ,由此可以估计中位数的值,由此可以估计中位数的值相等相等2.02t0.060.020.040.140.250.220.150.040.08频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 0.080.160.300.440.500.280.120.08

16、0.042.02这个中位数的估计值这个中位数的估计值,与样本的中位数与样本的中位数2.0不一样不一样,你能解释其中的原因吗你能解释其中的原因吗?0.060.020.040.140.250.220.150.040.08频率频率/组距组距月平均用水量月平均用水量/t0.500.400.300.200.10 0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 0.080.160.300.440.500.280.120.080.04 3.平均数是频率分布直方图的平均数是频率分布直方图的“重心重心”.是直方图的是直方图的平衡点平衡点,等于频率分布直方图中每个小矩形的面积乘,等于频率分布直方图中每

17、个小矩形的面积乘以小矩形底边中点的横坐标之和以小矩形底边中点的横坐标之和.居民月均用水量的平居民月均用水量的平均数均数?121()nXXXXn2.02t问问:某医院的记录表明,以往到急诊中心就诊某医院的记录表明,以往到急诊中心就诊的病人需等待的时间的频率分布如下:的病人需等待的时间的频率分布如下:等待时间(min)0, 5)5, 10)10, 15)15, 20)20, 25)频率0.200.400.250.100.05估计到这个中心就疹的病人平均需要等待的时间是估计到这个中心就疹的病人平均需要等待的时间是 9.5min2.5 0.207.5 0.40 12.5 0.2517.5 0.1022

18、.5 0.059.5x 频率分布直方图损失了一些样本原始数据,得频率分布直方图损失了一些样本原始数据,得到的是一个估计值,且所得估值与数据分组有关到的是一个估计值,且所得估值与数据分组有关. . 注注: :在只有样本频率分布直方图的情况下,我们在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并可以按上述方法估计众数、中位数和平均数,并由此估计总体特征由此估计总体特征. .如何根据样本如何根据样本频率分布直方图频率分布直方图,分别估计总,分别估计总体的体的众数众数、中位数中位数和和平均数平均数?(1 1)众数:众数:最高矩形下端中点的横坐标最高矩形下端中点的横坐标.

19、 .(2 2)中位数:中位数:直方图面积平分线与横轴交直方图面积平分线与横轴交点的横坐标点的横坐标. .(3 3)平均数:平均数:每个小矩形的面积与小矩形底每个小矩形的面积与小矩形底边中点的横坐标的乘积之和边中点的横坐标的乘积之和. . .,nnnnpxpxpxpppxxx 22112121则其平均数为的频率为若取值为一般地某工厂有经理1人,另有6名管理人员,5名高级技工,10名工人和1名学徒.现在需要增加一名新工人.小张前来应聘,经理说 :我公司报酬不错,平均工资1500元.小张工作几天后找到经理说 :你欺骗了我,我问过其他工人,没有一个工人的月工资超过1000元.平均工资怎么可能是1500

20、元呢?经理拿出如下工资表说 :你看,平均工资就是1思考500元.5003450000010500500075000112311056150010001001250100011计合数人月工资合计学徒工人技工管理人员经理员人 平均数平均数向我们提供了样本数据的重要信息向我们提供了样本数据的重要信息,但是但是平均数有时也会使我们作出对总体的片面判数断因平均数有时也会使我们作出对总体的片面判数断因为这个平均数掩盖了一些极端的情况,而这些极端情为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽的况显然是不能忽的因此,只有平均数还难以概括样因此,只有平均数还难以概括样本数据的实际状态本数据的实际

21、状态 如:有两位射击运动员在一次射击测试中各如:有两位射击运动员在一次射击测试中各射靶射靶10次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:乙:乙: 如果你是教练如果你是教练,你应当如何对这次射击作出评价你应当如何对这次射击作出评价?如果看两人本次射击的平均成绩如果看两人本次射击的平均成绩,由于由于77乙甲x,x 两人射击两人射击 的平均成绩是一样的的平均成绩是一样的.那么那么,是否两个人就没有是否两个人就没有 水平差距吗水平差距吗?标准差标准差 有两位射击运动员在一次射击测试中各射靶十次,每次有两位射击运动员在一次射击测试中各射靶十次,每次命中的环数如下:命中的环数如下:直观上看直

22、观上看,还是有差异的还是有差异的.很明显很明显, 甲的成绩比较分散甲的成绩比较分散, 乙的成绩相对集中乙的成绩相对集中因此因此,我们需要从另外的角度来考察这两组数据我们需要从另外的角度来考察这两组数据.考察样本数据的分散程度的大小,最常用的统考察样本数据的分散程度的大小,最常用的统计量是标准差标准差是样本数据到平均数的计量是标准差标准差是样本数据到平均数的一种平均距离,一般用一种平均距离,一般用s s表示表示所谓所谓“平均距离平均距离”,其含义可作如下理,其含义可作如下理解:解:xxxx,n是平均距离的到样本数据于是”“,21.21nxxxxxxSn).,2,1(nixxi的距离是:到。表示这

23、组数据的平均数假设样本数据是xxxxxxin,21由于上式含有绝对值,运算不太方便,因此,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算通常改用如下公式来计算标准差标准差.)()()(122221xxxxxxnsn样本中的个体与平均数之间的距离关系可用下图表示样本中的个体与平均数之间的距离关系可用下图表示:考虑一个容量为考虑一个容量为2的样本的样本:.2,2,121221xxaxxxx记其样本的标准差为221xxx1x2xa显然显然,标准差越大标准差越大,则则a越大越大,数据的离散程度越数据的离散程度越大大;标准差越小标准差越小,数据的离散程度越小数据的离散程度越小.例例2 甲乙两人同时生产内径为甲乙两人同时生产内径为25.40mm的一种零件的一种零件.为了对两人的生产质量进行评比为了对两人的生产质量进行评比,从他们生产的零件中从他们生产的零件

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论