2015-2016学年北师大版必修3 用样本估计总体 课件(27张)_第1页
2015-2016学年北师大版必修3 用样本估计总体 课件(27张)_第2页
2015-2016学年北师大版必修3 用样本估计总体 课件(27张)_第3页
2015-2016学年北师大版必修3 用样本估计总体 课件(27张)_第4页
2015-2016学年北师大版必修3 用样本估计总体 课件(27张)_第5页
已阅读5页,还剩22页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、复习回顾复习回顾抽样方法抽样方法简单随机抽样简单随机抽样分层抽样分层抽样抽签法抽签法随机数表法随机数表法 抽样过程中每个个体被抽取的机会相等抽样过程中每个个体被抽取的机会相等, 体现了体现了抽样的客观性与公平性抽样的客观性与公平性系统抽样系统抽样 为了考察一个总体的情况为了考察一个总体的情况,在统计中通常是从总体中抽在统计中通常是从总体中抽取一个样本取一个样本, 用样本的有关情况去估计总体相应的情况用样本的有关情况去估计总体相应的情况. 这种估计大体分为两类:这种估计大体分为两类: 一类是用样本的某种数字特征一类是用样本的某种数字特征(例如平均数、标准差等例如平均数、标准差等)去估计总体的相应

2、数字特征去估计总体的相应数字特征.一类是用样本的频率分布去估计总体分布一类是用样本的频率分布去估计总体分布;5 用样本估计总体用样本估计总体(1)一、估计总体的分布一、估计总体的分布例例1 . 为了了解某地区高二学生的身体发育情况为了了解某地区高二学生的身体发育情况, 抽查了地区抽查了地区100名年龄为名年龄为16.5岁至岁至17岁的男生的体重情况岁的男生的体重情况, 结果如下结果如下(单位单位:kg):60.5 69.5 65 61.5 64.5 66.5 64 64.5 62 58.572 73.5 59 67 70 57.5 65.5 68 71 7562 68.5 62.5 66 59

3、.5 63.5 64.5 67.5 73 6864 72 66.5 74 63 60 55 70 64.5 5864 70.5 57 62.5 65 69 71.5 73 62 5874 71 66 63.5 60.5 59.5 63.5 65 70 74.568.5 64 55.5 72.5 66.5 68 76 61 60 6857 69.5 74 64.5 59 61.5 67 68 63.5 5859 65.5 62.5 69.5 72 64.5 61 68.5 64 6265.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5请你估计该地区年龄为请你估计该地

4、区年龄为16.5岁至岁至17岁的男生体重的分布情况岁的男生体重的分布情况.解解: 这里这里, 如果把总体看作是该地区年龄为如果把总体看作是该地区年龄为16.5岁至岁至17岁的男生体重岁的男生体重, 那么那么我们就要通过上面的样本信息我们就要通过上面的样本信息, 来估计总体的分布情况来估计总体的分布情况. 但从抽样的数据很但从抽样的数据很难直接估计出总体的分布情况难直接估计出总体的分布情况.60.5 69.5 65 61.5 64.5 66.5 64 64.5 62 58.572 73.5 59 67 70 57.5 65.5 68 71 7562 68.5 62.5 66 59.5 63.5

5、64.5 67.5 73 6864 72 66.5 74 63 60 55 70 64.5 5864 70.5 57 62.5 65 69 71.5 73 62 5874 71 66 63.5 60.5 59.5 63.5 65 70 74.568.5 64 55.5 72.5 66.5 68 76 61 60 6857 69.5 74 64.5 59 61.5 67 68 63.5 5859 65.5 62.5 69.5 72 64.5 61 68.5 64 6265.5 58.5 67.5 70.5 65 66 66.5 70 63 59.5 为此为此, 我们可以先将抽样的数据按每个数据出

6、现我们可以先将抽样的数据按每个数据出现的频数和频率汇成下表的频数和频率汇成下表: 体重体重/kg频数频数频率频率5510.0155.510.015720.0257.510.015830.0358.520.025930.0359.530.036020.0260.520.026120.0261.520.026240.04体重体重/kg频数频数频率频率62.530.036320.0263.540.046450.0564.560.066540.0465.530.036630.0366.540.046720.0267.520.026850.0568.530.03体重体重/kg频数频数频率频率6910.0

7、169.530.037040.0470.520.027120.0271.510.017230.0372.510.017320.0273.510.017430.0374.510.017510.017610.01解解: 这里这里, 如果把总体看作是该地区年龄为如果把总体看作是该地区年龄为16.5岁至岁至17岁的男生体重岁的男生体重, 那么那么我们就要通过上面的样本信息我们就要通过上面的样本信息, 来估计总体的分布情况来估计总体的分布情况. 但从抽样的数据很但从抽样的数据很难直接估计出总体的分布情况难直接估计出总体的分布情况. 为此为此, 我们可以先将抽样的数据按每个数据出现我们可以先将抽样的数据按

8、每个数据出现的频数和频率汇成下表的频数和频率汇成下表: 体重体重/kg频数频数频率频率5510.0155.510.015720.0257.510.015830.0358.520.025930.0359.530.036020.0260.520.026120.0261.520.026240.04体重体重/kg频数频数频率频率62.530.036320.0263.540.046450.0564.560.066540.0465.530.036630.0366.540.046720.0267.520.026850.0568.530.03体重体重/kg频数频数频率频率6910.0169.530.03704

9、0.0470.520.027120.0271.510.017230.0372.510.017320.0273.510.017430.0374.510.017510.017610.01解解: 这里这里, 如果把总体看作是该地区年龄为如果把总体看作是该地区年龄为16.5岁至岁至17岁的男生体重岁的男生体重, 那么那么我们就要通过上面的样本信息我们就要通过上面的样本信息, 来估计总体的分布情况来估计总体的分布情况. 但从抽样的数据很但从抽样的数据很难直接估计出总体的分布情况难直接估计出总体的分布情况. 从表格中从表格中, 我们就能估计出总体大致的分布情况了我们就能估计出总体大致的分布情况了, 如在年

10、龄如在年龄为为16.5岁至岁至17岁之间岁之间, 男生的体重主要在男生的体重主要在5872kg之间之间, 58kg以下以下及及72kg以上所占的比率相对较小等以上所占的比率相对较小等. 但是但是, 这些关于分布情况的描述仍不够直观形象这些关于分布情况的描述仍不够直观形象, 为了得到为了得到更为直观的信息更为直观的信息, 我们可以再将表中的数据按照下表的方式分组我们可以再将表中的数据按照下表的方式分组. 为此为此, 我们可以先将抽样的数据按照下表进行我们可以先将抽样的数据按照下表进行分组分组:解解: 这里这里, 如果把总体看作是该地区年龄为如果把总体看作是该地区年龄为16.5岁至岁至17岁的男生

11、体重岁的男生体重, 那么那么我们就要通过上面的样本信息我们就要通过上面的样本信息, 来估计总体的分布情况来估计总体的分布情况. 但从抽样的数据很但从抽样的数据很难直接估计出总体的分布情况难直接估计出总体的分布情况.分组分组(xi) 频频 数数(ni) 频频 率率(fi)54.5,56.5)20.0256.5,58.5)60.0658.5,60.5)100.1060.5,62.5)100.1062.5,64.5)140.1464.5,66.5)160.1666.5,68.5)130.1368.5,70.5)110.1170.5,72.5)80.0872.5,74.5)70.0774.5,76.5

12、)30.03频数频数0454.5812162056.558.560.562.564.566.568.570.572.574.576.5体重体重频数分布直方图频数分布直方图 为此为此, 我们可以先将抽样的数据按照下表进行我们可以先将抽样的数据按照下表进行分组分组:解解: 这里这里, 如果把总体看作是该地区年龄为如果把总体看作是该地区年龄为16.5岁至岁至17岁的男生体重岁的男生体重, 那么那么我们就要通过上面的样本信息我们就要通过上面的样本信息, 来估计总体的分布情况来估计总体的分布情况. 但从抽样的数据很但从抽样的数据很难直接估计出总体的分布情况难直接估计出总体的分布情况.分组分组(xi) 频

13、频 数数(ni) 频频 率率(fi)54.5,56.5)20.0256.5,58.5)60.0658.5,60.5)100.1060.5,62.5)100.1062.5,64.5)140.1464.5,66.5)160.1666.5,68.5)130.1368.5,70.5)110.1170.5,72.5)80.0872.5,74.5)70.0774.5,76.5)30.03fi /xi0.010.030.050.050.070.080.0650.0550.040.0350.015分组分组(xi)fi /xi54.5,56.5)0.0156.5,58.5)0.0358.5,60.5)0.056

14、0.5,62.5)0.0562.5,64.5)0.0764.5,66.5)0.0866.5,68.5)0.06568.5,70.5)0.05570.5,72.5)0.0472.5,74.5)0.03574.5,76.5)0.01500.0254.556.558.560.562.564.566.568.570.572.574.576.5体重体重0.040.060.080.10iixf 思考交流思考交流1.体重位于哪个区间的人数最多体重位于哪个区间的人数最多?2.体重在体重在64.566.5kg的频率约的频率约是多数是多数?3.体重小于体重小于64.5kg的频率约的频率约是多数是多数?4.体重在体

15、重在63.565.5kg的频率约的频率约是多数是多数?64.5,66.5)16%42%15%抽象概括抽象概括:00.0254.556.558.560.562.564.566.568.570.572.574.576.5体重体重(kg)0.040.060.080.10iixf 52.578.5 上图中上图中, 每个小矩形的宽度为每个小矩形的宽度为xi(分组的宽度)(分组的宽度), 高高为为 , 小矩形的面积恰为相应的频率小矩形的面积恰为相应的频率 fi . iixf 通常称这样的图形为通常称这样的图形为频率分布直方图频率分布直方图. 当样本容量较大时当样本容量较大时, 样本中落在每个区间内的样本数

16、的频率样本中落在每个区间内的样本数的频率会稳定于总体在相应区间内取值的概率会稳定于总体在相应区间内取值的概率. 因此因此, 我们就可以用样本的我们就可以用样本的频率分布直方图频率分布直方图来估计总体在任来估计总体在任意区间内取值的概率意区间内取值的概率, 也即也即总体的分布总体的分布情况情况.频率折线图频率折线图00.0254.556.558.560.562.564.566.568.570.572.574.576.5体重体重(kg)0.040.060.080.10iixf 52.578.5频率折线图频率折线图注意注意:折线与横轴所围成的面积是折线与横轴所围成的面积是1.00.0254.556.

17、558.560.562.564.566.568.570.572.574.576.5体重体重(kg)0.040.060.080.10iixf 52.578.5频率折线图频率折线图 如果样本容量取得足够大如果样本容量取得足够大, 分组的组距取得足够小分组的组距取得足够小, 则相应则相应的频率折线图将趋于一条光滑的曲线的频率折线图将趋于一条光滑的曲线.我们称这条光滑的曲线为我们称这条光滑的曲线为总体的密度曲线总体的密度曲线.例例2.为了了解一大片经济林生长情况为了了解一大片经济林生长情况. 随机测量其中的随机测量其中的100株树株树木的底部周长木的底部周长, 得到如下数据表得到如下数据表(单位单位:

18、cm)135981021109912111096100103125971171131109210210910411210912487131971021231041041281051231111031059211410810410212912697100115111106117104109111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108(1)编制频率分布表)编制频率分布表

19、; (2)绘制频率分布直方图)绘制频率分布直方图; (3)估计)估计该片经济林中底部周长小于该片经济林中底部周长小于100cm的树木约占多少的树木约占多少, 周长不小周长不小于于120cm的树木约占多少的树木约占多少.解解: (1)这组数据的最大值是)这组数据的最大值是135, 最小值是最小值是80, 全距是全距是55.1359810211099121110961001031259711711311092102109104112109124871319710212310410412810512311110310592114108104102129126971001151111061171041

20、09111891101218012012110410811812999909912112310711191100991011169710210810195107101102108117991181061199712610812311998121101113102103104108可将其分为可将其分为11组组, 组距为组距为5.解解: (1)这组数据的最大值是)这组数据的最大值是135, 最小值是最小值是80, 全距是全距是55.可将其分为可将其分为11组组, 组距为组距为5.分组分组(xi)频频 数数(ni)频频 率率(fi)fi /xi80,85)10.010.00285,90)20.020

21、.00490,95)40.040.00895,100)140.140.028100,105)240.240.048105,110)150.150.030110,115)120.120.024115,120)90.190.018120,125)110.110.022125,130)60.060.012130,135)20.020.004(2)直方图如图)直方图如图:00.0180859095100105110115120125130135周长周长/cm0.020.030.040.05iixf (3)样本小于)样本小于100的频率为的频率为: 0.21样本不小于样本不小于120的频率为的频率为:

22、0.19估计该片经济林中底部周长小于估计该片经济林中底部周长小于100cm的树木约占的树木约占21%, 周长不小周长不小于于120cm的树木约占的树木约占19%.问题提出问题提出 在日常生活中在日常生活中, 我们不仅需要了解总体的分布形态我们不仅需要了解总体的分布形态, 有时会更关心总体的某些数字特征有时会更关心总体的某些数字特征.5 用样本估计总体用样本估计总体(2)一、估计总体的数字特征一、估计总体的数字特征1.分析理解分析理解 1996年奥运会风帆比赛前年奥运会风帆比赛前7场比赛场比赛(共比赛共比赛11场场)结束后结束后, 排名前排名前5名的选手积分如下名的选手积分如下:排排名名运动员运

23、动员比赛场次比赛场次总分总分12345678910 111李丽珊李丽珊(香港香港)3222427222简度简度(新西兰新西兰)23611055323贺根贺根(挪威挪威)7844318354威尔逊威尔逊(英国英国)55145564445李科李科4135927646 根据上面的比赛结果根据上面的比赛结果, 我们如何比较各选手之间的成绩及稳我们如何比较各选手之间的成绩及稳定情况呢定情况呢? 如果此时让你预测谁将获得最后胜利如果此时让你预测谁将获得最后胜利, 你会怎样看你会怎样看?5位选手前位选手前7场比赛积分的平均数和标准差如下场比赛积分的平均数和标准差如下:3.336.57李科李科53.196.2

24、9威尔逊威尔逊(英国英国)42.515.00贺根贺根(挪威挪威)32.774.57简度简度(新西兰新西兰)21.733.14李丽珊李丽珊(香港香港)1积分标准差积分标准差(s) 平均积分平均积分运动员运动员排名排名)(x从上表中可见从上表中可见: 李丽珊的李丽珊的平均积分平均积分及及积分标准差积分标准差都比其他选手的小都比其他选手的小,这说明这说明, 在在前前7场的比赛中场的比赛中,她的成绩最为优秀她的成绩最为优秀, 且且表现最为稳定表现最为稳定. 假定每位运动员在各自的假定每位运动员在各自的11场比赛中发挥的水平大致相同场比赛中发挥的水平大致相同, 因因而可以把前而可以把前7场比赛看作是总体

25、的一个样本场比赛看作是总体的一个样本, 并由此估计每位运动员并由此估计每位运动员最后比赛的成绩最后比赛的成绩.事实验证了我们的预测事实验证了我们的预测: 李丽珊正是凭着自己优李丽珊正是凭着自己优异而稳定的表现异而稳定的表现, 成为香港首位奥运金牌得主的成为香港首位奥运金牌得主的. 2.思考交流思考交流(1)若取前)若取前3场比赛、前场比赛、前5场比赛、前场比赛、前9场比赛作为样本去估场比赛作为样本去估计总体结果各会怎样计总体结果各会怎样? 哪一种与哪一种与11场比赛结束后的结果最接近场比赛结束后的结果最接近?(2)若全部比赛已结束)若全部比赛已结束, 假如你的同桌与你抽取的样本容量相假如你的同

26、桌与你抽取的样本容量相同同, 你们两人的样本平均积分和积分标准差一定相同吗你们两人的样本平均积分和积分标准差一定相同吗?样本频样本频率分布直方图呢率分布直方图呢?(3)若全部比赛已结束)若全部比赛已结束, 假如你用同样的方法先后从总体中抽假如你用同样的方法先后从总体中抽取了两个大小相同的样本取了两个大小相同的样本, 两次得到的样本平均积分和积分标两次得到的样本平均积分和积分标准差一定相同吗准差一定相同吗?样本频率分布直方图呢样本频率分布直方图呢?为什么为什么?排排名名运动员运动员比赛场次比赛场次总分总分12345678910 111李丽珊李丽珊(香港香港)3222427222简度简度(新西兰新

27、西兰)23611055323贺根贺根(挪威挪威)7844318354威尔逊威尔逊(英国英国)55145564445李科李科41359276463.抽象概括抽象概括 用样本估计总体时用样本估计总体时, 如果抽样的方法比较合理如果抽样的方法比较合理, 那么样本可那么样本可以反映总体的信息以反映总体的信息, 但从样本得到的信息会有但从样本得到的信息会有偏差偏差. 在随机抽样在随机抽样中中, 这种偏差是不可避免的这种偏差是不可避免的. 虽然我们从样本数据得到的分布、平均数和标准差(通常虽然我们从样本数据得到的分布、平均数和标准差(通常称之为样本分布、样本平均数和样本标准差)并不是总体真正称之为样本分布

28、、样本平均数和样本标准差)并不是总体真正的分布、平均数和标准差的分布、平均数和标准差. 而只是总体的一个估计而只是总体的一个估计, 但这种估计但这种估计是合理的是合理的, 特别是当样本容量很大时特别是当样本容量很大时, 它们确实反映了总体的信它们确实反映了总体的信息息.4.例题与练习例题与练习.在一批试验田里对某种早稻品种进行栽培实验,抽测了其在一批试验田里对某种早稻品种进行栽培实验,抽测了其 中中15块试验田的单位面积的产量如下(单位:块试验田的单位面积的产量如下(单位:)504 402 495 492 500 501 405 409 460 486 460 371 420 456 395这

29、批试验田的单位面积产量约是多少?这批试验田的单位面积产量约是多少?解:解:把这批试验田里每块试验田的单位面积的产量的全体称把这批试验田里每块试验田的单位面积的产量的全体称为总体为总体,那么这那么这15块试验田的单位面积产量就是这个总体的一块试验田的单位面积产量就是这个总体的一个样本个样本.用计算器算得样本平均数为用计算器算得样本平均数为 ()(),450 x 由此可以估计由此可以估计, 这批试验田的单位面积产量约是这批试验田的单位面积产量约是450.504 402 495 492 500 501 405 409460 486 460 371 420 456 395这批试验田的单位面积产量约是多

30、少?这批试验田的单位面积产量约是多少?解:解:把这批试验田里每块试验田的单位面积的产量的全体称把这批试验田里每块试验田的单位面积的产量的全体称为总体为总体,难么这难么这15块试验田的单位面积产量就是这个总体的块试验田的单位面积产量就是这个总体的一个样本一个样本.由此可以估计由此可以估计, 这批试验田的单位面积产量约是这批试验田的单位面积产量约是450. 发现这些数据都在发现这些数据都在460附近波动附近波动,每个数据都减去每个数据都减去460,得到一组新数据得到一组新数据,4458353240415551268940465新数据的平均数是新数据的平均数是 144659.615x 样本平均数是样

31、本平均数是 ()()4609.6450 x .在一批试验田里对某种早稻品种进行栽培实验,抽测了其在一批试验田里对某种早稻品种进行栽培实验,抽测了其 中中15块试验田的单位面积的产量如下(单位:块试验田的单位面积的产量如下(单位:)样本平均数公式样本平均数公式 121nxxxxn(1)当所给数据比较分散时)当所给数据比较分散时(2)当所给数据都在某一数据)当所给数据都在某一数据a附近波动时,附近波动时,xxa(3)当所给数据重复出现时,)当所给数据重复出现时, 1112221kkkxx fx fx fnfffn (加权平均数)(加权平均数)灯泡甲:灯泡甲:1610 1590 1540 1650

32、1450 1650 1570 1630 1690 1720 1580 1620 1500 1700 1530 1670 1520 1690 1600 1590灯泡乙:灯泡乙:1670 1610 1550 1490 1430 1610 1530 1430 1410 1580 1520 1440 1500 1510 1540 1400 1420 1530 1520 1510 根据上述两个样本根据上述两个样本,你准备选哪种灯泡你准备选哪种灯泡?请说明理由请说明理由.某工厂研制甲、乙两种电灯泡,从两种电灯泡中各抽取了某工厂研制甲、乙两种电灯泡,从两种电灯泡中各抽取了20只进行寿命试验,得到如下数据只进

33、行寿命试验,得到如下数据 (单位(单位:小时):小时):甲、乙两种灯泡的样本平均数分别是甲、乙两种灯泡的样本平均数分别是 161015901590201605167016101510201510 xx甲甲乙乙 可以估计可以估计,甲种灯泡比乙种灯泡的平均使用甲种灯泡比乙种灯泡的平均使用寿命长一些寿命长一些.,xx甲甲乙乙由由想一想:1.用样本平均值去估计总体平均值一定准确吗?用样本平均值去估计总体平均值一定准确吗?2.你认为减少错误发生的途径有哪些?你认为减少错误发生的途径有哪些?采用更合理的抽样方法采用更合理的抽样方法增大样本的容量增大样本的容量解解:例例3.要从甲、乙两名男跳远运动员选拔一名

34、参加一次田径比赛要从甲、乙两名男跳远运动员选拔一名参加一次田径比赛.为此为此, 对两名运动员进行了对两名运动员进行了15次测验比赛次测验比赛, 成绩如下(单位:成绩如下(单位:cm)甲甲 755 752 757 744 743 729 721 731 778 768 761 773 764 736 741乙乙 729 767 744 750 745 753 745 752 769 743 760 755 748 752 747如何通过上述数据如何通过上述数据,来作出选人的决定来作出选人的决定?解解:每个数据都减去:每个数据都减去750,得到两组新数据得到两组新数据, 5 2 7 6 7 21

35、29 19 28 18 11 23 14 14 921 17 6 0 5 3 5 219 7 10 5 2 2 3x.x.0 20 6甲甲乙乙, S.2222215290 226915甲甲 S.222221211730 69215乙乙x.x.750 2750 6甲甲乙乙,这说明两人的平均成绩相差甚微这说明两人的平均成绩相差甚微SS 22甲甲乙乙所以乙的成绩稳定所以乙的成绩稳定, ,应选拔乙应选拔乙. .)()()(1222212xxxxxxnsn (1)2222212nxxxSxn(2)2222212nxxxSxn(3)练习练习1.从湖中打一网鱼从湖中打一网鱼, 共共m条条, 做上记号后再放入湖里做上记号后再放入湖里, 数天后数天后再打一网鱼共再打一网鱼共n条条, 其中其中k条有记号条有记号. 估计湖中有鱼大约估计湖中有鱼大约_条?条?练习练习2.要从甲乙丙三名选手中挑选一名同学参加数学竞赛要从甲乙丙三名选手中挑选一名同学参加数学竞赛,参考参考5 次平时成绩如下表:次平时成绩如下表:甲:甲:86 85 90 85 84乙:乙:70 95 85 83 97丙:丙:75 78 72 74 76 请你分析数据请你分析数据,作出选拔决定作出选拔决定.mnk解解:设湖中有设湖中有x条鱼条鱼, 则由则由,kmnx 可

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论