




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2.1总体取值规律的估计盛琪第九章统计2025/3/27引
入要求:综合材料内容及含义,选好角度,确定立意,明确文体,自拟题目,不得套作,不得抄袭。不少于800字。
二战期间,为了加强对战机的防护,英美军方调查了作战后的幸存飞机上弹痕的分布,决定哪里弹痕多就加强哪里。然而统计学家沃德力排众议,指出更应该注意弹痕少的位置,因为这些部位受到重创的飞机,很难有机会返航,而这部分数据被忽略了。事实证明,沃德是正确的。——2018全国二卷语文作文引
入这位统计学家在分析问题的时候,能够做到不被表面现象所迷惑,在获取数据之后,选择合适的工具对数据进行整理和直观描述,在此基础上,通过数据分析,找出数据中蕴含的信息,进而得到了正确的统计分析结果.前面研究学习了两种抽样来收集数据,数据收集后,必须从中寻找包含的信息,以使我们能通过样本的规律估计总体的规律,解决相应的实际问题.但由于数据多而杂,所以需要通过一定的方法去处理数据.可以通过表、图、计算方法来分析数据,进而对总体做出相应的估计.引
入问题1
我们在初中学过哪些统计图?条形图追问:条形图与直方图的区别是什么?折线图扇形图直方图下面我们讨论对随机抽样获取的数据的处理方法.探究新知引例
我国是世界上严重缺水的国家之一,城市缺水问题较为突出。某市政府为了节约生活用水,计划对居民生活用水费用实施阶梯式水价制度,即确定一户居民月均用水量标准a,用水量不超过a的部分按平价收费,超出a的部分按议价收费.
如果希望确定一个比较合理的标准,以使大部分居民用水的水费支出不受影响,你认为需要做哪些工作?为了确定一个较为合理的用水标准,必须先了解在全市所有居民用户中,月用水量在不同范围内的居民所占的比例情况.①全面调查(普查):时间,经费允许②抽样调查:总体:该市的全体居民用户个体:每户居民用户调查的变量:居民用户的均用水量.引
入假设通过随机抽样,获得了100户居民用户的月均用水量数据:(单位:t)问题2
从这组数据我们能发现什么信息呢?探究新知容易发现:这组数据的最小值时1.3t,最大值是28.0t,其它值在1.3t~28.0t之间.除此之外,很难从随意记录下来的数据中直接看出规律.为此,我们需要对数据进行整理和分析.分析数据的基本方法:1.用图将它们画出来:提取信息、传递信息.2.用表格:用紧凑的表格改变数据的排列形式,提供解释数据的新方式.探究新知初中我们曾经学过频数分布图和频数分布表,这使我们能够清楚地知道数据分布在各个小组的个数.频数:在统计学中,将样本按照一定的方法分成若干组,每组内含有这个样本的个体的数目叫做频数问题3
什么是频数?什么是频率?如何画频数分布表和频数分布直方图?探究新知频数分布图身高x频数频率146≤x<15020.0625150≤x<15430.09375154≤x<15860.1875158≤x<162120.375162≤x<16670.21875166≤x<17020.0625频数分布表频率:样本中某个组的频数和样本容量的比,叫做该数据的频率探究新知因此使用频率分布表和频率分布直方图在此实际问题中,我们更关心月均用水量在不同范围内的居民用户占全市居民用户的比例从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.它可以使我们看到整个样本数据的频率分布情况.频率分布是指一个样本的各个小组的数据在各个小范围所占比例的大小,一般用频率分布直方图反映样本的频率分布.探究新知1.频率分布表和频率分布直方图
画频率分布直方图的一般步骤为:①求极差②决定组距和组数③将数据分组④列频率分布表⑤画频率分布直方图探究新知探究1根据上述抽样的100户居民月均用水量,画出频率分布直方图.非负数(1)求极差:极差为一组数据中最大值与最小值的差.这说明样本观测的数据变化范围是26.7t.它反映了一组数据的最大幅度,对极端值敏感描述数据的离散程度28.0-1.3=26.7极差探究新知(2)决定组距与组数:极差、组距、组数之间的关系:组距是指每个小组的两个端点之间的距离.组距与组数的确定没有固定的标准,数据的分组可以是等距的,也可以是不等距的,为方便起见,往往按等距分组.注:y=[x]为取整函数,表示不超过x的最大整数.若取组距为3,则即可将数据分为9组;组数与数据的个数有关(样本容量)问题4这样分组合理吗?问题5组距为4时分几组?可以将数据分成7组.①样本容量越大,分组越多;②样本容量不超过100时,常分成5~12组,探究新知由于组距为3,9个组距的长度超过极差,我们可以使第一组的左端点略小于数据中的最小值,最后一组的右端点略大于数据中的最大值.例如:可以取区间为[1.2,28.2],按如下方式把样本数据以组距3分成9组:[1.2,4.2),[4.2,7.2),...,[25.2,28.2](3)将数据分组:通常对组内数据所在区间:左闭右开,最后一组取闭区间.探究新知统计频数,计算各小组的频率,作出频率分布表.(4)列频率分布表:
频率之和为1探究新知频率分布表一般分五列1.“分组”,2.“频数累计(可省),3.“频数”,4.“频率”,5.“频率/组距”最后一行是合计.频率/组距0.0770.1070.0430.0300.0300.0170.0100.0130.007探究新知(5)画频率分布直方图:横轴表示月均用水量小长方形的面积=组距×=频率各小长方形的面积和为1纵轴表示频率/组距实际上就是频率分布直方图中各小长方形的高度,它反映了各组样本观测数据的疏密程度。月平均用水量/t0.120.10.080.060.040.0201.24.27.2
10.213.216.219.222.225.228.20.1070.0430.0300.0300.0170.0100.0130.0070.077频率/组距探究新知(1)求极差(即一组数据中最大值与最小值的差)(2)决定组距与组数(将数据分组)(3)将数据分组方法小结:画频率分布直方图的一般步骤为:(4)列出频率分布表.(填写频率/组距一栏)(5)画出频率分布直方图.组距:指每个小组的两个端点的距离,组数:将数据分组,当数据在100个以内时,按数据多少常分5-12组.探究新知(2)从频率分布直方图能直观地表明数据分布的形状和总体趋势.可以看出,数据的分布不对称,图形左边高、右边低,右边有一个较长的“尾巴”。这表明大部分居民用户的月均用水量集中在一个较低值区域,尤其在[1.2,7.2)最为集中,少数用户居民的月均用水量偏多,而且随着月均用水量的增加,居民用户数呈现降低趋势.问题6观察频率分布表和频率分布直方图,你觉得这组数据中蕴含了哪些有用的信息?你能从图表中发现居民用户月均用水量的哪些分布规律?你能给出适当的语言描述吗?(1)从频率分布表中可以看出,样本观测数据落在各个小组的比例大小.例如,月均用水量在区间[4.2,7.2)内的居民用户最多,在区间[1.2,4.2)内的次之,而月均用水量超过16.2的各区间内数据所占比例较小,等等.探究新知有了样本观测数据的频率分布,我们可以用它估计总体的取值规律。根据100户居民用户的月均用水量的频率分布,可以推测该市全体居民用户月均用水量也会有类似的分布,即大部分居民用户月均用水量集中在较低值区域.需要注意的是,由于样本的随机性,这种估计可能会存在一定误差,但这一误差一般不会影响我们对总体分布情况的大致了解.这使我们确定用水量标准时,可以定一个合适的值,以达到既不影响大多数居民用户的水费支出,又能节水的目的.探究新知问题7
分别以3和27为组数,对数据进行等距分组,画出100户居民月均用水量的频率分布直方图,你发现不同的组数对直方图呈现数据分布规律有什么影响?组数少、组距大:易看出数据整体的分布特点,无法看出每组内的数据分布情况,损失了较多的原始数据信息;组数多、组距小:保留较多原始数据信息;但小长方形较多,有时图形会变得不规则,不容易从中看出总体分布特点;直方图会依赖样本数据,稳定性差.例题讲解解:由已知数据可得极差为69-42=27.[41.5,45.5),[45.5,49.5),···,[65.5,69.5].选取组距为4,由于故可将数据分为7组,即例题讲解列出频率分布表:例题讲解根据频率分布表画出频率分布直方图和频率分布折线图如图所示.探究新知探究新知D课堂练习2.一个容量为32的样本,已知某组样本的频率为0.125,那么该组样本的频数为()A.2B.4
C.6
D.8
BC课堂练习4.为了解某地高一学生的身体发育情况,抽查了该地区100名年龄在14-15岁的男生体重(kg),得到频率分布直方图如下:根据上图可得这100名学生中体重在[56.5,64.5]的学生人数是()A.20
B.30
C.40
D.50C0.08[56.5,65]44[56.5,a]的学生人数是46,a=()65.251.从某小区抽取100户居民用户进行月用电量调查,发现他们的用电量都在50~350kW‧h之间,进行适当分组后(每组为左闭右开的区间),画出频率分布直方图如图所示.(1)直方图中x的值为________;(2)在被调查的用户中,用电量落在区间[100,250)内的户数为_____.课堂练习700.0044教材197页课堂练习解:(1)通话时长在区间[15,20),[20,30)内的次数分别为9次和12次.(2)区间[20,30)内的通话次数少于区间[15,20内的通话次数.2.如图,胡晓统计了他爸爸9月的手机通话明细清单,发现他爸爸该月共通话60次.胡晓按每次通话时间长短进行分组(每组为左闭右开的区间),画出了频率分布直方图.(1)通话时长在区间[15,20),[20,30)内的次数分别为多少?(2)区间[20,30)上的小长方形高度低于[15,20)上的小长方形的高度,说明什么?课堂小结频率分布直方图应用步骤1.求极差2.决定组距与组数3.将数据分组4.列频率分布表5.画频率分布直方图布置作业(1)教材(2)同步作业THANKS9.2.1总体取值规律的估计盛琪第九章统计2025/3/27引入1.频率分布直方图中,纵轴表示:3.各小长方形的面积的总和等于1.复习引入1、某地政府调查了工薪阶层1000人的月工资,并根据调查结果画出如图所示的频率分布直方图,为了了解工薪阶层对月工资的满意程度,要用分层抽样的方法从调查的1000人中抽出100人做电话询访,则月工资在区间[30,35)内的工薪阶层应抽出________人.15解析:月工资落在区间[30,35)内的频率为1-(0.02+0.04+0.05+0.05+0.01)×5=0.15,课前练习所以月工资在区间[30,35)内的应抽出100×0.15=15(人).引入2、某校为了了解高三学生的身体状况,抽取了100名女生的体重.将所得的数据整理后,画出了如图的频率分布直方图,则所抽取的女生中体重在40~45kg的人数是A.10B.2C.5D.15A解析:由题图及频率=×组距,知体重在40~45kg的女生的频率=0.02×5=0.1.∴女生中体重在40~45kg的人数为0.1×100=10.引入3、为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:分组频数频率[145.5,149.5)10.02[149.5,153.5)40.08[153.5,157.5)200.40[157.5,161.5)150.30[161.5,165.5)80.16[165.5,169.5]mn合计MN(1)求出表中m,n,M,N所表示的数分别是多少;(2)画出频率分布直方图;∴m=2,M=1+4+20+15+8+2=50.解:(方法一)N=1.00,n=1-(0.02+0.08+0.40+0.30+0.16)=0.04,(方法二),m=50-(1+4+20+15+8)=2,引入3、为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:分组频数频率[145.5,149.5)10.02[149.5,153.5)40.08[153.5,157.5)200.40[157.5,161.5)150.30[161.5,165.5)80.16[165.5,169.5]20.04合计501(1)求出表中m,n,M,N所表示的数分别是多少;(2)画出频率分布直方图;解:作出直角坐标系,组距为4,纵轴表示
,横轴表示身高,画出频率分布直方图如图所示.频率/组距0.0050.020.10.0750.040.01引入3、为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:分组频数频率[145.5,149.5)10.02[149.5,153.5)40.08[153.5,157.5)200.40[157.5,161.5)150.30[161.5,165.5)80.16[165.5,169.5]20.04合计501(1)求出表中m,n,M,N所表示的数分别是多少;(2)画出频率分布直方图;解:作出直角坐标系,组距为4,纵轴表示
,横轴表示身高,画出频率分布直方图如图所示.频率/组距0.0050.020.10.0750.040.01引入3、为了了解九年级学生中女生的身高(单位:cm)情况,某中学对九年级女生身高进行了一次测量,所得数据整理后列出的频率分布表如下:(3)全体女生中身高在哪组范围内的人数最多?估计九年级学生中女生的身高在161.5cm以上的频率.解:由频率分布直方图可知,样本中身高在[153.5,157.5)范围内的人数最多,且身高在161.5cm以上的频率为0.16+0.04=0.2,
由此可估计全体女生中身高在[153.5,157.5)范围内的人数最多,九年级学生中女生的身高在161.5cm以上的频率为0.2.引入4、为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小矩形的面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,则该校高一年级全体学生的达标率约是多少?解:(1)频率分布直方图是以面积的形式来反映数据落在各小组内的频率大小的,(2)由直方图可估计该校高一年级全体学生的达标率约为引入
除频率分布直方图外,我们在初中还学习过条形图、扇形图、折线图、频数分布直方图等.
不同的统计图在表示数据上有不同的特点.例如,扇形图主要用于直观描述各类数据占总数的比例,条形图和直方图主要用于直观描述不同类别或分组数据的频数和频率,折线图主要用于描述数据随时间的变化趋势.不同的统计图适用的数据类型也不同.例如,条形图适用于描述离散型的数据,直方图适用于描述连续型的数据等.
因此,在解决问题的过程中,要根据实际问题的特点,选择恰当的统计图对数据进行可视化描述,以使我们通过图形直观地发现样本数据的分布情况,进而估计总体的分布规律.探究新知例1、已知某市2015年全年空气质量等级如下表所示.空气质量等级(空气质量指数(AQI))频数频率优(AQI≤50)8322.8%良(50<AQI≤100)12133.2%轻度污染(100<AQI≤150)6818.6%中度污染(150<AQI≤200)4913.4%重度污染(200<AQI≤300)308.2%严重污染(AQI>300)143.8%合计365100%2016年5月和6月的空气质量指数如下5月2408056539212645875660191625558565389901251241038189443453798162116886月63921101221021168116315876331026553385552769912712080108333573829014695选择合适的统计图描述数据,并回答下列问题:(1)分析该市2016年6月的空气质量情况;(2)比较该市2016年5月和6月的空气质量,哪个月的空气质量较好?(3)比较该市2016年6月与该市2015年全年的空气质量,2016年6月的空气质量是否好于去年?探究新知解:(1)作出2016年6月的不同空气质量等级的频数与频率分布表从表中可以看出,“优”“良”的天数达19天,占了整月的63.33%,没有出现“重度污染”和“严重污染”.空气质量等级合计优良轻度污染中度污染重度污染严重污染天数415920030比例13.33%50%30%6.67%00100%我们可以用条形图和扇形图对数据作出直观的描述.探究新知
从条形图可以看出,在前三个等级的占绝大多数,空气质量等级为“良”的天数最多,后三个等级的天数很少.
从扇形图中可以看出,空气质量为“良”的天数占了总天数的一半,大约有三分之二为“优”“良”,大多数“良”和“轻度污染”.因此,整体上6月的空气质量不错.探究新知(2)5月的不同空气质量等级的频数与频率分布表空气质量等级合计优良轻度污染中度污染重度污染严重污染天数321511031比例10%68%16%3%3%0100%我们还可以用折线图展示空气质量指数随时间的变化情况.探究新知为了便于比较,我们选用复合条形图,将两组数据同时反映到一个条形图上。通过条形图中柱的高低,可以更直观地进行两个月的空气质量的比较。由上图和上表发现,5月空气质量为“优”和“良”的总天数比6月多。所以,从整体上看,5月的空气质量略好于6月,但5月有重度污染,而6月没有。例题讲解(3)把2016年6月和2015年全年的空气质量进行比较,由于一个月和一年的天数差别很大,所以直接通过频数比较没有意义,应该转化成频率分布进行比较.可以通过二者的空气质量指数的频率分布直方图或空气质量等级的频率分布条形图进行比较.
通过上图可以看出,虽然2016年6月的空气质量为“优”的频率略低于2015年
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 小儿呼衰护理疾病查房
- 南红基础知识
- 廉政知识竞答
- 康复护理学给药
- 信息技术 第二册(五年制高职)课件 8.2.3.1 选择结构的语法
- 传统文化中秋课件
- 教育学概论第6章
- 护理院级培训师现场教学演示
- 幼儿园结膜炎预防知识
- 百事可乐销售代表入职培训资料whatwesell-1-revised
- 祈使句教学讲解课件
- 农业机械化第三章-播种施肥机械课件
- 小学生计算错误纠正策略论文
- 2023年4月自考02400建筑施工一试题及答案含评分标准
- 《实验骨伤科学》教学大纲-供五年制骨伤专业使用
- 河北省高中学业水平考试通用技术试题
- 【高中生物】基因工程的基本操作程序课件 2022-2023学年高二下学期生物人教版选择性必修3
- 沉浸式教学在初中英语阅读教学中的实践与研究 论文
- 投标前期顾客满意度调查表
- JJF 1281-2011烟草填充值测定仪校准规范
- GB/T 5271.31-2006信息技术词汇第31部分:人工智能机器学习
评论
0/150
提交评论