版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2.1用样本的频率分布估计总体分布1.了解分析数据的方法,知道估计总体频率分布的方法.2.了解频率分布折线图和总体密度曲线,会画频率分布直方图和茎叶图.3.理解频率分布直方图和茎叶图及其应用.1.分析数据的方法(1)借助于图形.用图将各个数据画出来,作图可以达到两个目的,一是从数据中提取信息;二是利用图形传递信息.(2)借助于表格.用紧凑的表格改变数据的排列方式,通过改变数据的构成形式,为我们提供解释数据的新方式.2.频率分布直方图(1)绘制步骤:①求极差,即一组数据中最大值与最小值的差.②决定组距与组数.组距与组数的确定没有固定的标准.一般来说,数据分组的组数与样本容量有关,样本容量越大,所分组数越多.当样本容量不超过100时,按照数据的多少,常分为5~12组.③将数据分组:按组距将数据分组,分组时,各组均为左闭右开区间,最后一组是闭区间.④
列频率分布表.一般分四列:分组、频数累计、频数、频率,最后一行是合计.其中频数合计应是样本容量,频率合计是1.⑤画频率分布直方图.画图时,应以横轴表示样本数据,纵轴表示频率/组距.其相应组距上的频率等于该组上的小长方形的面积.(2)意义:在频率分布直方图中,每个小长方形的面积表示相应组的频率,所有小长方形的面积的总和等于1.(3)频率分布的估计:频率分布是指各个小组数据在样本容量中所占比例的大小,可以用样本的频率分布估计总体的频率分布,频率分布表是反映样本的频率分布的表格.通过频率分布直方图和频率分布表可以看到样本的频率分布.归纳总结频率分布直方图的特征:直观、形象地反映了样本的分布规律,可以大致估计出总体的分布.但是从频率分布直方图中得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就被抹掉了.【做一做1】
如图所示是一个容量为200的样本的频率分布直方图,请根据图形中的数据填空.(1)样本数据落在[5,9)内的频率是
;
(2)样本数据落在[9,13)内的频数是
.
答案:(1)0.32
(2)723.频率分布折线图和总体密度曲线(1)类似于频数分布折线图,连接频率分布直方图中各小长方形上端的中点,就得到频率分布折线图.一般地,当总体中的个体数较多时,抽样时样本容量就不能太小.例如,如果要抽样调查一个省乃至全国的居民的月均用水量,那么样本容量就应比调查一个城市的时候大.可以想象,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.归纳总结频率分布折线图反映了数据的变化趋势.总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息.(2)估计方法:实际上,尽管有些总体密度曲线是客观存在的,但是在实际应用中我们并不知道它的具体表达形式,需要用样本来估计.由于样本是随机的,不同的样本得到的频率分布折线图不同;即使对于同一个样本,不同的分组情况得到的频率分布折线图也不同.频率分布折线图是随样本容量和分组情况的变化而变化的,因此不能由样本的频率分布折线图得到准确的总体密度曲线.【做一做2】
对于频率分布折线图与总体密度曲线的关系,下列说法中正确的是(
)A.频率分布折线图与总体密度曲线无关B.频率分布折线图就是总体密度曲线C.样本容量很大的频率分布折线图就是总体密度曲线D.如果样本容量无限增大,分组的组距无限缩小,那么频率分布折线图就会无限接近于一条光滑曲线,即为总体密度曲线答案:D4.茎叶图(1)制作方法:将所有两位数的十位数字作为茎,个位数字作为叶,茎相同者共用一个茎,茎按从小到大的顺序从上向下列出,共茎的叶可以按从大到小(或从小到大)的顺序同行列出(也可以没有大小顺序).(2)优缺点:在样本数据较少时,用茎叶图表示数据的效果较好.它不但可以保留所有信息,而且可以随时记录,这对数据的记录和表示都能带来方便.但是当样本数据较多时,茎叶图就显得不太方便,因为每一个数据都要在图中占空,如果数据很多,枝叶就会很长.归纳总结茎叶图的特征:统计图上没有原始数据信息的损失,所有数据信息都可以从茎叶图中得到;茎叶图中的数据可以随时记录,随时添加,方便记录与表示.【做一做3-1】
没有信息的损失,所有的原始数据都可以从图中得到的统计图是(
)A.总体密度曲线 B.茎叶图C.频率分布折线图 D.频率分布直方图答案:B【做一做3-2】
如图是12名学生某次测试分数的茎叶图,由图可知,这些分数的最低分与最高分之和为
.
答案:1471.理解频率分布直方图剖析:(1)频率分布直方图中,每个小长方形的面积等于样本中数据落在该组的频率,也就是样本中数据落在该组的百分比.(3)频率分布直方图中各小长方形的面积和等于1.(4)频率分布指的是一个样本数据在各个小范围内所占比例的大小.一般用频率分布直方图反映样本的频率分布.(5)频率分布直方图能够把大量数据的分布情况直观地表现出来,但是在频率分布直方图中我们读不出原始的数据.也就是说,在反映样本的频率分布方面,频率分布表能确切地反映相关数据,频率分布直方图能直观地反映相关数据的分布规律,它们起着相互补充的作用.2.频率分布表、频率分布直方图、频率分布折线图和茎叶图的优缺点比较剖析:如下表:题型一题型二题型三频率分布直方图的绘制与应用【例1】
一个农技站为了考察某种麦穗长的分布情况,在一块试验地里抽取了100个麦穗,量得长度如下(单位:cm):6.5
6.4
6.7
5.8
5.9
5.9
5.2
4.0
5.4
4.65.8
5.5
6.0
6.5
5.1
6.5
5.3
5.9
5.5
5.86.2
5.4
5.0
5.0
6.8
6.0
5.0
5.7
6.0
5.56.8
6.0
6.3
5.5
5.0
6.3
5.2
6.0
7.0
6.46.4
5.8
5.9
5.7
6.8
6.6
6.0
6.4
5.7
7.46.0
5.4
6.5
6.0
6.8
5.8
6.3
6.0
6.3
5.65.3
6.4
5.7
6.7
6.2
5.6
6.0
6.7
6.7
6.05.6
6.2
6.1
5.3
6.2
6.8
6.6
4.7
5.7
5.75.8
5.3
7.0
6.0
6.0
5.9
5.4
6.0
5.2
6.06.3
5.7
6.8
6.1
4.5
5.6
6.3
6.0
5.8
6.3题型一题型二题型三根据上面的数据列出频率分布表、绘出频率分布直方图,并估计长度在[5.75,6.05)cm之间的麦穗在这批麦穗中所占的百分比.分析:依据步骤画出频率分布直方图;用样本中的百分比(即频率)来估计长度在[5.75,6.05)cm之间的麦穗在这批麦穗中所占的百分比.解:步骤是:(1)计算极差,7.4-4.0=3.4(cm).(2)决定组距与组数.若取组距为0.3
cm,由于需分成12组,组数合适.于是取定组距为0.3
cm,组数为12.(3)将数据分组.使分点比数据多一位小数,并且把第1小组的起点稍微减小一点.则所分的12个小组可以是[3.95,4.25),[4.25,4.55),[4.55,4.85),…,[7.25,7.55].题型一题型二题型三(4)列频率分布表.对各个小组作频数累计,然后数频数,算频率,列频率分布表,如下表所示:题型一题型二题型三题型一题型二题型三(5)画频率分布直方图,如图.从表中看到,样本数据落在[5.75,6.05)之间的频率是0.28,于是可以估计,在这块地里,长度在[5.75,6.05)cm之间的麦穗约占28%.反思本题画频率分布直方图时,小长方形的高易错用该组的频率的大小来表示.其原因是不清楚频率分布直方图纵轴的意义.由于画频率分布直方图的步骤比较烦琐,因此在实际操作的过程中要有足够的耐心.题型一题型二题型三【变式训练1】
为了检测某种产品的质量,抽取了一个容量为100的样本,数据的分组情况与频数如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几;(4)估计数据小于11.20的可能性是百分之几.题型一题型二题型三解:(1)频率分布表如下:题型一题型二题型三(2)频率分布直方图及频率分布折线图如图:(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15),所以x-0.41=0.13,即x=0.54,从而估计数据小于11.20的可能性是54%.题型一题型二题型三茎叶图的绘制与应用【例2】
某中学高一(2)班甲、乙两名同学自进入高中以来每次数学考试成绩情况如下:甲的得分:95,75,86,89,71,65,76,88,94,110,107;乙的得分:83,86,93,99,88,103,98,114,98,79,101.画出两人数学成绩的茎叶图.请根据茎叶图对两人的数学成绩进行比较.分析:用中间的数字表示两位同学得分的十位数和百位数,两边的数字分别表示两人每次数学考试成绩的个位数.题型一题型二题型三解:甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,且集中在90分左右;甲同学的得分情况除一个特殊得分外,也大致对称,且集中在80分左右.因此乙同学发挥比较稳定,且总体得分情况比甲同学好.题型一题型二题型三反思用茎叶图表示数据的特点如下:(1)用茎叶图表示数据有两个突出的优点,一是统计图上没有原始信息的损失,所有的数据信息都可以从茎叶图中得到;二是茎叶图可以在比赛时随时记录,用3|
3
8
9就表示了33,38,39这3个数据,方便记录与表示.(2)茎叶图在样本数据较少,较为集中且位数不多时比较适用.因为它较好地保留了原始数据,所以可以帮助分析样本数据的大致频率分布.题型一题型二题型三【变式训练2】
在某高中篮球联赛中,甲、乙两名运动员的得分如下(单位:分):甲的得分:14,17,25,26,30,31,35,37,38,39,44,48,51,53,54;乙的得分:6,9,15,17,18,21,27,28,33,35,38,40,44,46,56.(1)用茎叶图表示上面的样本数据;(2)分析甲、乙两名运动员中哪一位发挥得更加稳定.题型一题型二题型三解:(1)茎叶图如图所示:(2)从茎叶图中可以看出,甲运动员的得分大致对称,乙运动员的得分也大
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 花园石板施工方案(3篇)
- 红色出行应急预案(3篇)
- 货运飞船技术全览
- 2025年企业内部控制制度设计与实施
- 电影院员工服务规范与培训制度
- 2025年企业人力资源规划与实施手册
- 办公室员工培训效果总结报告制度
- 办公室员工离职交接制度
- 养老院老人健康饮食服务质量管理制度
- 2026年深圳市信银企业服务有限公司招聘备考题库参考答案详解
- 2026年七台河职业学院单招综合素质考试备考试题带答案解析
- 内蒙古包头市昆都仑区2025-2026学年七年级上学期期末考试道德与法治试卷(含答案)
- GB/T 18344-2025汽车维护、检测、诊断技术规范
- 第六单元课外古诗词诵读《南安军》说课稿 2023-2024学年统编版语文九年级下册
- 食堂2023年工作总结及2024年工作计划(汇报课件)
- 机器学习课件周志华Chap08集成学习
- 殡仪馆鲜花采购投标方案
- T-GDWCA 0035-2018 HDMI 连接线标准规范
- 面板堆石坝面板滑模结构设计
- 无人机装调检修工培训计划及大纲
- GB/T 3683-2023橡胶软管及软管组合件油基或水基流体适用的钢丝编织增强液压型规范
评论
0/150
提交评论