




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2.1用样本的频率分布估计总体分布主讲人:张斌
二、收集数据有哪几种基本的抽样方法简单随机抽样、系统抽样、分层抽样.抽样收集数据分析样本数据对总体作出估计一、统计的基本思想方法:复习回顾分析数据的基本方法是:(1)用图将它们画出来作图可以达到两个目的,一是从数据中提取信息,二是利用图形传递信息。(2)用紧凑的表格改变数据的排列方式表格通过改变数据的构成形式,为我们提供解释数据的新方式。
下面将从频率分布表和频率分布直方图,来分析数据分布的规律.从这些数字中,我们能得到什么信息?整理数据的两种基本方法:用紧凑的表格改变数据的排列方式用图将它们画出来通过抽样调查,获得了我市100户居民某年的月均用水量如下表(单位:t):初中曾学过频数分布表和频数分布直方图.下面将学习频率分布表和频率分布直方图,它们是从各小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.频率:身高/cm3530252015105122126130134138142146150154158O学生人数知识探究1频率分布表第一步:求极差数据中最大值与最小值的差.思考1:上述100个样本数据的变化范围是什么?4.3-0.2=4.1思考2:分成多少组合适呢?第二步:决定组距与组数
组距:每个小组两端点的距离;组数:组数k=极差/组距当数据在100个以内时,按数据多少,常分5—12组;若k不是整数,则组数=[k]+1.4.1÷0.5=8.2,故可取组数为9按组距为0.5进行分组,上述数据据共分为几组?第四步:列频率分布表计算各小组的频率,列出下面的频率分布表.第三步:将数据分组[0,0.5),[0.5,1),[1,1.5),[1.5,2),[2,2.5),[2.5,3),[3,3.5),[3.5,4),[4,4.5]思考3:如何设定各组数据的范围呢?各组均为左闭右开区间,最后一组是闭区间思考4:你能将这些数据用表格反映出来吗?
频率分布表一般分5列:1、“分组”2、“频数累计”(可省)3、“频数”4、“频率”
5、“频率/组距”列频率分布表:分组频数累计频数频率频率/组距[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]合计频数的合计为样本容量频率合计为148152225146420.040.080.150.220.250.140.060.041001.000.020.080.160.300.440.500.280.120.080.04为直观反映样本数据在各组中的分布情况,我们将上述频率分布表中的有关信息用下面的频率分布直方图表示:月均用水量/t0.050.100.20频率/组距第一步:画平面直角坐标系.第二步:在横轴上均匀标出各组分点,在纵轴上标出单位长度.第三步:以组距为宽,各组的频率/组距为高,分别画出各组对应的小长方形y轴:频率/组距知识探究2频率分布直方图0.40011.52.53.52340.54.50.150.250.300.350.450.50分组频率/组距[0,0.5)[0.5,1)[1,1.5)[1.5,2)[2,2.5)[2.5,3)[3,3.5)[3.5,4)[4,4.5]0.080.160.300.440.500.280.120.080.041、各组频率在图中怎么显示出来?长方形的面积=组距频率=组距×频率3、你能根据上述频率分布直方图,指出样本居民月均用水量的一些数据特点吗?月均用水量/t0.050.100.20频率/组距0.40011.52.53.52340.54.50.150.250.300.350.450.502、各小长方体面积之和是否为定值?各小长方形的面积之和为1.月均用水量/t0.080.04频率/组距011.52.53.52340.54.50.160.280.300.120.440.50思考6:同一组数据,若组距不同,得到的条形图会不会相同?思考5:如果市政府希望85%以上的居民月用水量不超过标准,根据上述频率分布直方图,你对制定居民月用水量标准(即a的取值)有何建议?月均用水量/t0.080.04频率/组距011.52.53.52340.54.50.160.280.300.120.440.50
在频率分布直方图中,依次连接各小长方形上端的中点,得到频率分布折线图.知识探究3频率分布折线图o频率/组距月均用水量/t思考7:当样本容量无限增大,组距无限缩小,那么频率分布折线图会发生怎样的变化?月均用水量/t0.080.04频率/组距011.52.53.52340.54.50.160.280.300.120.440.500.440.50一条光滑的曲线!频率组距月均用水量/tab
(图中阴影部分的面积,表示总体在某个区间(a,b)内取值的百分比)。当样本容量无限增大,组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线——总体密度曲线。
用样本分布直方图去估计相应的总体分布时,一般样本容量越大,频率分布直方图就会越接近总体密度曲线,就越精确地反映了总体的分布规律,即越精确地反映了总体在各个范围内取值百分比。
反映了总体在各个范围内取值的百分比,精确地反映了总体的分布规律。是研究总体分布的工具.总体密度曲线尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计。由于样本是随机的,不同的样本得到的频率分布折线图不同;即使同一样本,不同的分组情况得到的频率分布折线图也不同。频率分布折线图是随着样本的容量和分组情况的变化而变化的。因此不能由样本的频率分布折线图得到准确的总体密度曲线。思考8:可以用样本的频率分布折线图得到
准确的总体密度曲线吗?思考9.频率分布直方图有哪些优缺点?优点:从频率分布直方图可以清楚的看出数据分布的总体趋势.缺点:从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.甲乙
012345茎叶图
某赛季甲、乙两名运动员每场比赛得分的原始记录如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,3983643688391
2545116769940知识探究4012348050571153茎叶甲
乙8463368389
101234554616
7990【问题】某赛季甲、乙两名篮球运动员每场比赛的得分情况如下:甲运动员得分:13,51,23,8,26,38,16,33,14,28,39;乙运动员得分:49,24,12,31,50,31,44,36,15,37,25,36,39.你能理解这个图是如何记录这些数据的吗?你能算出甲、乙运动员得分的众数,中位数,平均数吗?你能通过该图说明哪个运动员的发挥更稳定吗?你认为茎叶图有哪些优点?(1)保留了原始数据,没有损失样本信息;(2)数据可以随时记录、添加或修改.
对任意一组样本数据,是否都适合用茎叶图表示?
为什么?不适合样本容量很大.思考:例1
下表给出了某校500名11岁男孩中用随机抽样得出的120人的身高(单位:cm):
(1)完成样本频率分布表(频率保留小数点后两位数字);
(2)请同学们画出频率分布直方图;
(3)估计身高小于134cm的男孩数占总男孩数的百分比.
例题精讲区间界限[122,126)[126,130)[130,134)[134,138)[138,142)人数58102233区间界限[142,146)[146,150)[150,154)[154,158]人数201165解(1)样本频率分布表如下(请同学们口答):分组频数频率频率/组距[122,126)5[126,130)8[130,134)10[134,138)22[138,142)33[142,146)20[146,150)11[150,154)6[154,158]5合计1200.18
0.070.080.040.170.091.00
0.0450.01750.02
0.01
0.070.04250.01250.02250.040.010.28
0.05(2)频率分布直方图(请同学们作图):身高/cm0.070.060.050.040.030.020.01122126130134138142146150154158O(3)估计身高小于134cm的男孩数占总男孩数的百分比.频率/组距
由频率分布直方图可知,身高小于134cm的男孩出现的频率为0.04+0.07+0.08=0.19,所以我们估计身高小于134cm的男孩数占总男孩数的19%.0.040.070.08分组频率/组距[122,126)0.01[126,130)0.0175[130,134)0.02[134,138)0.045[138,142)0.07[142,146)0.0425[146,150)0.0225[150,154)0.0125[154,158]0.01快问快答CB0.21.有一个容量为200的样本,其频率分布直方图如右图所示.根据样本频率分布直方图,试估计:样本数据落在区间[10,12)内的频数为()(A)18(B)36(C)54(D)722.为比较A、B两种治疗失眠症的药的疗效,随机选取20位患者服用A药,另20位患者服用B药,这40位患者在服药一段时间后,记录他们日均增加的睡眠时间(单位:h)如下茎叶图.从茎叶图看,
药的疗效更好.
A药
B药60.89565528521.79234681243976532872.4615710523.2牛刀小试BA3.为了了解某地区高三学生的身体发育情况,抽查了该地区100名年龄为17.5岁-18岁的男生体重(kg),得到频率分布直方图如下:C0.030.050.07体重(kg)频率/组距54.558.562.566.570.574.5根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是(
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 考试心态调整特许金融分析师考试试题及答案
- 证券投资中的人机结合分析试题及答案
- 2025年财务报告标准变动试题及答案
- 2025年CFA考试资本市场操作试题及答案
- 微生物分析报告的撰写技巧试题及答案
- 2024年项目管理新挑战及应对策略试题及答案
- 预备工作2025年证券从业资格证试题及答案
- 矿山安全应急预案与演练-石墨滑石考核试卷
- 2025年审计审查重点试题及答案
- 矿山环境管理与生态断层监测考核试卷
- 广东省2024-2025学年佛山市普通高中教学质量检测物理试卷及答案(二)高三试卷(佛山二模)
- 【9数一模】2025年安徽合肥市第四十五中学九年级中考一模数学试卷(含答案)
- 电网工程设备材料信息参考价(2024年第四季度)
- 北师大版数学六年级下册-总复习课件(精编版)
- 经济效益证明(模板)
- 汽车总装车辆返工返修作业标准管理办法
- D建筑消防设施故障维修记录表
- DB43∕T 497-2009 博落回果-行业标准
- 黑龙江省哈尔滨市恒泰石材有限公司(扩大区)建筑用凝灰岩
- 创意综艺风脱口秀活动策划PPT模板
- 枣树桃小食心虫
评论
0/150
提交评论