用样本频率分布估计总体分布_第1页
用样本频率分布估计总体分布_第2页
用样本频率分布估计总体分布_第3页
用样本频率分布估计总体分布_第4页
用样本频率分布估计总体分布_第5页
已阅读5页,还剩30页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

用样本的频率分布估计总体分布复习1随机抽样包括哪几种?2简单随机抽样又包括几种方法,适用于什么样的个体,一般步骤,优点和缺点?3系统抽样适用于什么样的个体,一般步骤,优点和缺点?4分层抽样适用于什么样的个体,一般步骤,优点和缺点?复习1,抛掷硬币的大量重复试验的频率分布表:0501104989样本容量为72088什么叫频率分布条形图?频数?频率?0.10.20.30.40.50.60.701试验结果频率“正面向上”记为0“反面向上”记面向上正面向上频率频数实验结果注意点:①各直方长条的宽度要相同,宽窄与频率无关;②相邻长条之间的间隔要适当;频率试验结果01正面向上反面向上0.5③条形图的高度就是频率;当试验次数无限增大时,两种试验结果的频率就成为相应的概率:0.5反面向上(记为1)0.5正面向上(记为0)概率试验结果排除了抽样造成的误差,精确地反映了总体取值的概率分布规律。这种总体取值的概率分布规律称为总体分布。1频率分布与总体分布的关系:

⑴通过样本的频数分布、频率分布可以估计总体的概率分布。

⑵研究总体概率分布往往可以研究其样本的频数分布、频率分布。

2总体分布:总体取值的概率分布规律

在实践中,往往是从总体中抽取一个样本,用样本的频率分布去估计总体分布一般地,样本容量越大,这种估计就越精确。

练习1在100名学生中,每人参加一个运动队,其中参加田径队的有13人,参加体操队的有10人,参加足球队的有24人,参加篮球队的有27人,参加排球队的有15人,参加乒乓球队的有11人1列出学生参加各运动队的频率分布表;2画出表示频率分布的条形图

试验结果

频数频率参加田径队(1)130.13参加体操队(2)100.10参加足球队(3)240.24参加篮球队(4)270.27参加排球队(5)150.15参加乒乓球队(6)110.11解:频率分布表如下:频率分布条形图如下:152346频率结果2某市政府为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民月用水量标准a,用水量不超过a的部分按平价收费,超过a的部分按议价收费。①如果希望大部分居民的日常生活不受影响,那么标准a定为多少比较合理呢?②为了较合理地确定这个标准,你认为需要做哪些工作?思考:由上表,大家可以得到什么信息?通过抽样,我们获得了100位居民某年的月平均用水量单位:t),如下表:1求极差(即一组数据中最大值与最小值的差)2决定组距与组数组数=43-02=414.10.5=8.2组距极差=3将数据分组[0,05,[05,1,…,[4,45]组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。组距:指每个小组的两个端点的距离,4列频率分布表注意:这里出来了条形图中条形的宽度。频率不仅与条形的高度有关,而且与它的宽度有关。为了使选择不同宽度的总体分布相同,我们用另一种图形表示,即直方图——用面积表示概率。100位居民月平均用水量的频率分布表频率/组距月平均用水量/t0.500.400.300.200.1000.511.522.533.544.5

5画频率分布直方图小长方形的面积组距频率=组距×频率=注意:①这里的纵坐标不是频率,而是频率/组距;②某个区间上的概率用这个区间的面积表示;直方图思考:所有小长方形的面积之和等于?探究:同样一组数据,如果组距不同,横轴、纵轴的单位不同,得到的图的形状也会不同。不同的形状给人以不同的印象,这种印象有时会影响我们对总体的判断。分别以1和01为组距重新作图,然后谈谈你对图的印象。一、求极差,即数据中最大值与最小值的差二、决定组距与组数:组距=极差/组数三、分组,通常对组内数值所在区间,取左闭右开区间,最后一组取闭区间四、登记频数,计算频率,列出频率分布表画一组数据的频率分布直方图,可以按以下的步骤进行:五、画出频率分布直方图(纵轴表示频率/组距)频率分布直方图如下:月均用水量/t频率组距0.100.200.300.400.500.511.522.533.544.5连接频率分布直方图中各小长方形上端的中点,得到频率分布折线图利用样本频分布对总体分布进行相应估计(3)当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。(2)样本容量越大,这种估计越精确。(1)上例的样本容量为100,如果增至1000,其频率分布直方图的情况会有什么变化?假如增至10000呢?频率组距月均用水量(mm)ab当样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近一条光滑曲线——总体密度曲线.总体在区间内取值的概率S总体密度曲线频率组距月均用水量/tab(图中阴影部分的面积,表示总体在某个区间a,b内取值的百分比)。用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。总体密度曲线反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具总体密度曲线频率/组距月平均用水量/t0.500.400.300.200.100

0.511.522.533.544.5

如果当地政府希望85%以上的居民每月的用水量不超出标准,根据频率分布表和频率分布直方图,你能对制定月用水量提出建议吗你认为3吨这个标准一定能够保证85%以上的居民用水量不超过标准吗例题一个容量为100的样本,数据的分组和各组的相关信息如下表,试完成表中每一行的两个空格分组

频数

频率

频率累计[12,15)6[15,18)0.08[18,21)0.30[21,24)21[24,27)0.69[27,30)16[30,33)0.10[33,36]1.00合计1001.0000600680140161602105101818016085100950055例1、对某电子元件进行寿命追踪调查,情况如下:

寿命个数100~200200~300300~400400~500500~6002030804030(1)列出频率分布表;(2)画出频率分布直方图;(3)估计电子元件寿命在100h~400h以内的概率;(4)估计电子元件寿命在400h以上的概率;应用举例:

(1)列出频率分布表;

100~200200~300300~400400~500500~600寿命合计频率频数累积频率20308040302000.100.150.400.200.1510.100.250.650.851频率/组距茎叶图情境:某赛季甲、乙两名篮球运动员每场比赛得分的原始记录如下:1甲运动员得分:13,51,23,8,26,38,16,33,14,28,392乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39问题:如何有条理地列出这些数据,分析该运动员的整体水平及发挥的稳定程度?茎叶图甲乙0123452554161679490846368389

1一般地:当数据是一位和两位有效数字时,用中间的数字表示十位数,即第一个有效数字,两边的数字表示个位数,即第二个有效数字,它的中间部分像植物的茎,两边部分像植物茎上长出来的叶子,因此通常把这样的图叫做茎叶图。茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出。1.茎叶图的概念:

2.茎叶图的特征:

1)用茎叶图表示数据有两个优点:一是从统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;二是茎叶图中的数据可以随时记录,随时添加,方便记录与表示;

2)茎叶图只便于表示两位(或一位)有效数字的数据,对位数多的数据不太容易操作;而且茎叶图只方便记录两组的数据,两个以上的数据虽然能够记录,但是没有表示两个记录那么直观,清晰;

3)茎叶图对重复出现的数据要重复记录,不能遗漏.制作茎叶图的方法是:将所有两位数的十位数字作为“茎”,个位数字作为“叶”,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶一般按从大到小(或从小到大)的顺序同行列出茎叶图的制作方法注意:在制作茎叶图时,重复出现的数据要重复记录,不能遗漏,特别是“叶”部分;同一数据出现几次,就要在图中体现几次用茎叶图表示数据有两个突出的优点:一是所有的信息都可以从这个茎叶图上得到;二是茎叶图便于记录和表示用茎叶图表示数据有一个突出的缺点:茎叶图的缺点是其分析只是粗略的,对差异不大的两组数据不易分析;表示三位数以上的数据时不够方便1、求极差即一组数据中最大值与最小值的差知道这组数据的变动范围43-02=412、决定组距与组数(将数据分组)3、将数据分组82取整,分为9组小结:一画频率分布直方图的步骤4、列出频率分布表填写频率/组距一栏5、画出频率分布直方图。组距:指每个小组的两个端点的距离,组距组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组。(注意)纵坐标为:二总体密度曲线1当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。2用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会无限接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。三茎叶图

茎叶图,类似直方图,但又与直方图不同,它的思路是将数组的数按位数进行比较,将数大小基本不变或变化不大的位作为一个主杆(茎),将变化大的位的数作为分枝(叶),列在主杆的后面,这样就可以清楚地看到每个主杆后面的几个数,每个数具体是多少。

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论