版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
3
用样本估计总体分布第六章统计北师大版
数学
必修第一册基础落实·必备知识一遍过重难探究·能力素养速提升目录索引
学以致用·随堂检测促达标课程标准1.了解频率与频数对总体的估计情况.2.理解用样本的频率分布估计总体的分布的方法.3.会列频率分布表,画频率分布直方图、频率折线图.4.能够利用频率分布直方图解决实际问题.基础落实·必备知识一遍过知识点1
频率分布表与频率分布直方图1.基本概念名称概念频数、频率将一批数据按要求分为若干个组,各组内数据的个数,叫作该组的频数.每组频数除以全体数据个数的商叫作该组的频率.频率反映该组数据在样本中所占比例的大小样本的频率分布根据随机所抽样本的大小,分别计算某一事件出现的频率,这些频率的分布规律(取值状况)就叫作样本的频率分布极差若一组数据的最小值为a,最大值为b,则b-a的差就叫作极差组距把所有数据分成若干组,每个小组的两个端点之间的距离称为组距2.频率分布表和频率分布直方图的意义从一个总体得到一个包含大量数据的样本时,我们很难从一个个数据中直接看出样本所含的信息.如果把这些数据整理成频率分布表或频率分布直方图,就可以比较清楚地看出样本数据的频率分布,从而估计总体的分布情况.用样本估计总体,是研究统计问题的一个基本思想方法,而对于总体分布,我们总是用样本频率分布对它进行估计.3.频率分布表与频率分布直方图的制作步骤(1)频率分布是指从各个小组数据在样本容量中所占比例大小的角度,来表示数据分布的规律.(2)一般用频率分布直方图反映样本的频率分布.(3)画频率分布直方图的一般步骤为:第一步,求极差.第二步,确定组距和组数.为了方便起见,组距的选择应力求“取整”,极差、组距、组数有如下关系:①若
为整数,则
=组数;②若
不为整数,则
+1=组数.([x]表示不大于x的最大整数)第三步,分组.通常对组内数值所在区间取左闭右开区间,最后一组取闭区间.第四步,列频率分布表.统计各组数据的频数,计算频率,填入表格中,完成频率分布表.第五步,依据频率分布表画频率分布直方图.画图时,以横轴表示样本数据,纵轴(小长方形的高)表示频率与组距的比值.名师点睛频率分布直方图的特征总体分布情况可以通过样本频率分布情况来估计,样本频率分布是总体分布的一种近似表示,频率分布表和频率分布直方图有以下特征:(1)从频率分布直方图可以清楚地看出数据分布的总体趋势.(2)从频率分布直方图得不出原始的数据内容,把数据表示成直方图后,原有的具体数据信息就被抹掉了.(3)频率分布表和频率分布直方图由样本决定,因此它们会随样本的变化而变化.(4)若固定分组数,随着样本容量的增加,频率分布表中各个频率会稳定在某一个值的附近,从而频率分布直方图中的各个小长方形的高度也会稳定在特定的值上.思考辨析1.为什么要对样本数据进行分组?2.频数分布表与频率分布直方图有什么不同?提示
不分组很难看出样本中的数据所包含的信息,分组后,计算出频率,从而估计总体的分布特征.提示
频数分布表能使我们清楚地知道数据分布在各个小组的个数,而频率分布直方图则是从各个小组数据在样本容量中所占比例大小的角度来表示数据分布的规律.自主诊断1.判断正误.(正确的画√,错误的画×)(1)一般样本容量越大,所分组数越多;样本容量越小,所分组数越少.(
)(2)频率分布直方图的纵坐标表示频率.(
)(3)频率分布直方图中小矩形的面积表示该组的频数.(
)√××2.[人教B版教材例题]某市为了制定合理的节水方案,对家庭用水情况进行了调查,通过抽样,获得了某年100个家庭的月均用水量(单位:t),将数据按照[0,1),[1,2),[2,3),[3,4),[4,5]分成5组,制成了如图所示的频率分布直方图.(1)求图中a的值;(2)设该市有10万个家庭,估计全市月均用水量不低于3t的家庭数;(3)假设同组中的每个数据都用该组区间的中点值代替,估计全市家庭月均用水量的平均数.解
(1)因为频率分布直方图所有矩形的面积之和为1,所以(0.12+0.22+0.36+a+0.12)×1=1,解得a=0.18.(2)抽取的样本中,月均用水量不低于3
t的家庭所占比例为(a+0.12)×1=0.3=30%,因此估计全市月均用水量不低于3
t的家庭所占比例也为30%,所求家庭数为100
000×30%=30
000.(3)因为0.12×0.5+0.22×1.5+0.36×2.5+0.18×3.5+0.12×4.5=2.46,所以估计全市家庭月均用水量的平均数为2.46.知识点2
频率折线图在频率分布直方图中,按照分组原则,再在左边和右边各加一个区间,从所加的左边区间的中点开始,用线段依次连接各个矩形的顶端中点,直至右边所加区间的中点,就可以得到一条折线,我们称之为频率折线图.名师点睛频率折线图的优点是它反映了数据的变化趋势,随着样本容量的不断增加,分组的不断加密,频率折线图就会越来越接近于一条光滑的曲线.自主诊断
判断正误.(正确的画√,错误的画×)(1)分组越密的频率分布直方图得到的频率折线图越光滑.(
)(2)频率折线图不能反应数据的变化趋势.(
)√×微拓展总体密度曲线的特征(1)在样本频率分布直方图中,随着样本容量的增加,作图时所分的组数增加,组距减小,相应的频率折线图会越来越接近于一条光滑曲线,统计学中称这条光滑曲线为总体密度曲线,如图所示.(2)总体密度曲线反映了总体在各个范围内取值的百分比,它能给我们提供更加精细的信息,图中阴影部分的面积,就是总体在区间(a,b)内取值的百分比.重难探究·能力素养速提升探究点一频数与频率的有关计算【例1】
已知一个容量是40的样本,把它分成六组,第一组到第四组的频数分别是5,6,7,10,第五组的频率是0.2,那么第六组的频数是
,频率是
.
4
0.1规律方法
频数与频率的求解策略对于频数与频率的问题,首先要明确几个等量关系,即各组的频数之和等于样本容量,各组的频率之和为1,频率=.在解题过程中,要明确频数、频率以及样本容量之间的关系,弄清已知、未知,选择合适的公式进行解题.探究点二画频率分布直方图、频率折线图【例2】
某省为了了解和掌握2023年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)13598
10211099
12111096
100103125 97 117 113 110 92 102 109 104 112105 124 87 131 97 102 123 104 104 128109 123 111 103 105 92 114 108 104 102129 126 97 100 115 111 106 117 104 109111 89 110 121 80 120 121 104 108 118129 99 90 99 121 123 107 111 91 10099 101 116 97 102 108 101 95 107 101102 108 117 99 118 106 119 97 126 108123 119 98 121 101 113 102 103 104 108(1)列出频率分布表;(2)画出频率分布直方图和频率折线图;(3)估计该省考生数学成绩在[100,120)分之间的比例.解
在100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为
=11.(1)频率分布表如下:分组频数频率[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计1001.000.200(2)根据频率分布表中的有关信息画出频率分布直方图及频率折线图,如图所示.(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.规律方法
组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,使数据的分布规律能较清楚地呈现出来,组数太多或太少都会影响对数据分布情况的了解,若样本容量不超过120个时,按照数据的多少常分为5组~12组,一般样本容量越大,所分组数越多.变式训练1
为了检测某种产品的质量(单位:g),抽取了一个容量为100的样本,数据的分组情况与频数如下:[10.75,10.85),3;[10.85,10.95),9;[10.95,11.05),13;[11.05,11.15),16;[11.15,11.25),26;[11.25,11.35),20;[11.35,11.45),7;[11.45,11.55),4;[11.55,11.65],2.(1)列出频率分布表;(2)画出频率分布直方图以及频率分布折线图;(3)根据上述图表,估计数据落在[10.95,11.35)范围内的可能性是百分之几;(4)估计数据小于11.20的可能性是百分之几.
解
(1)频率分布表如下:质量分组/g频数频率[10.75,10.85)30.03[10.85,10.95)90.09[10.95,11.05)130.13[11.05,11.15)160.16[11.15,11.25)260.26[11.25,11.35)200.20[11.35,11.45)70.07[11.45,11.55)40.04[11.55,11.65]20.02合计1001.00(2)频率分布直方图及频率分布折线图如图:(3)由上述图表可知数据落在[10.95,11.35)范围内的频率为0.13+0.16+0.26+0.20=0.75=75%,即数据落在[10.95,11.35)范围内的可能性是75%.(4)数据小于11.20的可能性即数据小于11.20的频率,设为x,则(x-0.41)÷(11.20-11.15)=(0.67-0.41)÷(11.25-11.15),所以x-0.41=0.13,即x=0.54,从而估计数据小于11.20的可能性是54%.探究点三频率分布直方图的应用角度1频率分布直方图中的计算问题【例3】
某校在5月份开展了科技月活动.在活动中某班举行了小制作评比,规定作品上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图).已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多,有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?解
(1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x,x.参加评比的作品总数为a,又(2x+3x+4x+6x+4x+x)×5=1,解得a=60(件).(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x×5×a=18(件).(3)第四组上交的作品数为18,第六组上交的作品数为x×5×a=3件,则它们的获奖率分别为规律方法
1.频率分布直方图的性质(1)因为小矩形的面积=组距×
=频率,所以各小矩形的面积表示相应各组的频率.这样,频率分布直方图就以面积的形式反映了数据落在各个小组内的频率大小;(2)在频率分布直方图中,各小矩形的面积之和等于1;(3)
=样本容量.2.频率分布直方图反映了样本在各个范围内取值的可能性,由抽样的代表性利用样本在某一范围内的频率,可近似地估计总体在这一范围内取值的可能性.变式训练2为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图如图所示,图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110或110以上为达标,试估计该校全体高一学生的达标率是多少?角度2利用频率分布直方图估计总体分布【例4】
一个农技站为了考察某种大麦穗生长的分布情况,在一块试验田里抽取了100株麦穗,量得长度如下(单位:cm):6.5
6.4
6.7
5.8
5.9
5.9
5.2
4.0
5.4
4.65.8
5.5
6.0
6.5
5.1
6.5
5.3
5.9
5.5
5.86.2
5.4
5.0
5.0
6.8
6.0
5.0
5.7
6.0
5.56.8
6.0
6.3
5.5
5.0
6.3
5.2
6.0
7.0
6.46.4
5.8
5.9
5.7
6.8
6.6
6.0
6.4
5.7
7.46.0
5.4
6.5
6.0
6.8
5.8
6.3
6.0
6.3
5.65.3
6.4
5.7
6.7
6.2
5.6
6.0
6.7
6.7
6.05.6
6.2
6.1
5.3
6.2
6.8
6.6
4.7
5.7
5.75.8
5.3
7.0
6.0
6.0
5.9
5.4
6.0
5.2
6.06.3
5.7
6.8
6.1
4.5
5.6
6.3
6.0
5.8
6.3根据上面的数据列出频率分布表,绘制出频率分布直方图,并估计在这块试验田里长度在5.75~6.35cm之间的麦穗所占的百分比.解
(1)计算极差:7.4-4.0=3.4.(2)决定组距与组数:若取组距为0.3,因为
≈11.3,需分为12组,组数合适,所以取组距为0.3,组数为12.(3)分组所分的12个小组可以是3.95~4.25,4.25~4.55,4.55~4.85,…,7.25~7.55.分组频数频率[3.95,4.25)10.01[4.25,4.55)10.01[4.55,4.85)20.02[4.85,5.15)50.05[5.15,5.45)110.11[5.45,5.75)150.15[5.75,6.05)280.28[6.05,6.35)130.13[6.35,6.65)110.11[6.65,6.95)100.10[6.95,7.25)20.02[7.25,7.55]10.01合计1001.00(4)列频率分布表:(5)绘制频率分布直方图如图.从表中看到,样本数据落在5.75~6.35之间的频率是0.28+0.13=0.41,于是可以估计,在这块试验田里长度在5.75~6.35
cm之间的麦穗约占41%.规律方法
1.频率分布表能比较准确地反映样本的频率分布,而频率分布直方图则能直观地反映样本的频率分布.2.估计总体分布时,样本容量越大,估计越准确.变式训练3公交车的数量太多容易造成资源的浪费,太少又难以满足乘客的需求.为此,公交公司在某站台随机调查了80名乘客,他们的候车时间如下所示(单位:分钟):17
14
20
12
10
24
18
17
1
2213 19 28 5 34
7
25
18
28
115 31 12 11 10
16
12
9
10
1319 10 12 12 16
22
17
23
16
1516 11 9 3 13
2
18
22
19
923 28 15 21 28
12
11
14
15
311 6 2 18 25
5
12
15
20
1612 28 20 12 28
15
8
32
18
9(1)将数据进行适当的分组,并画出相应的频率分布直方图和频率折线图.(2)候车时间15分钟以上的频率是多少?你能为公交公司提出什么建议?解
(1)该数据中最大值为34,最小值为1,两者之差为33,故取组距为5,分为7组.分组频数频率
[0,5)60.0750.015[5,10)90.112
50.022
5[10,15)220.2750.055[15,20)220.2750.055[20,25)100.1250.025[25,30)80.1000.020[30,35]30.037
50.007
5频率分布直方图如图所示:频率折线图如图所示:(2)候车时间不低于15分钟的比例为0.275+0.125+0.100+0.037
5=0.537
5.建议:公交公司可以适当增加公交车的数量.本节要点归纳1.知识清单:(1)频数与频率的关系;(2)列频率分布表、画频率分布直方图与频率折线图;(3)频率分布直方图的应用.2.方法归纳:数据分析.3.常见误区:误把频率分布直方图中的纵坐标当成频率,导致计算错误.学以致用·随堂检测促达标123456A级必备知识基础练1.[探究点一]已知样本:10,8,6,10,13,8,10,12,11,7,8,9,11,9,12,9,10,11,12,11,那么频率为0.4的范围是(
)A.5.5~7.5 B.7.5~9.5C.9.5~11.5 D.11.5~13.5C解析
由题可得,频率分布表如下:分组频数频率[5.5,7.5)20.1[7.5,9.5)60.3[9.5,11.5)80.4[11.5,13.5]40.2合计201从表中可以看出,频率为0.4的范围是9.5~11.5,故选C.1234561234562.[探究点三]某工厂对一批产品进行了抽样检测,如图是根据抽样检测后的产品净重数据绘制的频率分布直方图,其中产品净重的范围是[96,106],样本数据分组为[96,98),[98,100),[100,102),[102,104),[104,106].已知样本中产品净重小于100g的个数是36,则样本中净重大于或等于98g并且小于104g的产品的个数是(
)A.90 B.75
C.60
D.45A123456解析
由频率分布直方图可知,产品净重小于100
g的频率是0.05×2+0.1×2=0.3,所以样本中产品的个数为
=120.由图知,产品净重大于或等于98
g而小于104
g的频率为(0.1+0.15+0.125)×2=0.75,则净重在此范围内的产品个数为120×0.75=90.1234563.[探究点三]将容量为n的样本中的数据分成6组,绘制频率分布直方图,若第一组至第六组的频率之比为1∶4∶4∶6∶3∶2,且前三组数据的频数之和等于27,则n=
.
601234564.[探究点三]某电子商务公司对10000名消费者的消费情况进行统计,发现消费金额(单位:万元)都在区间[0.3,0.9]内,其频率分布直方图如图所示.(1)a=
;
(2)在这些购物者中,消费金额在区间[0.5,0.9]内的购物者的人数为
.
36000
123456解析
(1)由0.1×1.5+0.1×2.5+0.1a+0.1×2.0+0.1×0.8+0.1×0.2=1,解得a=3.(2)区间[0.3,0.5)内的频率为0.1×1.5+0.1×2.5=0.4,故[0.5,0.9]内的频率为1-0.4=0.6.因此,消费金额在区间[0.5,0.9]内的购物者的人数为0.6×10
000=6
000.1234565.(多选题)某市教体局对全市高三年级的学生身高进行抽样调查,随机抽取了100名学生,他们的身高都处在A,B,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年度数据中心基础设施建设合同范本6篇
- 二零二五版基础小学门卫岗位职责与待遇聘用合同3篇
- 商场电梯维修与保养合同(二零二五年)2篇
- 二零二五年度离婚协议书起草与子女抚养权执行服务合同范本3篇
- 买卖2024年经济型住宅房屋合同书
- 2025年70米烟囱拆除工程材料采购与质量控制合同3篇
- 2025版旅游地产开发投资合同4篇
- 2025年无锡市二手房买卖合同范本细则解读3篇
- 年度Β-内酰胺类抗菌药物竞争策略分析报告
- 年度超精过滤设备竞争策略分析报告
- 投标报价明显低于采购预算价说明函
- 福建师范大学(答案)课程考试2023年2月《刑事诉讼法》作业考核试题
- 写人事物景作文课件
- 厂级安全培训资料
- 中国药科大学《药物化学》教学日历
- 露天矿山课件
- 经济效益证明(模板)
- 银行卡冻结怎么写申请书
- 果树蔬菜病害:第一章 蔬菜害虫
- 人工地震动生成程序
- SSB变桨系统的基础知识
评论
0/150
提交评论