高中数学人教A版必修3课件221用样本的频率分布估计总体分布_第1页
高中数学人教A版必修3课件221用样本的频率分布估计总体分布_第2页
高中数学人教A版必修3课件221用样本的频率分布估计总体分布_第3页
高中数学人教A版必修3课件221用样本的频率分布估计总体分布_第4页
高中数学人教A版必修3课件221用样本的频率分布估计总体分布_第5页
已阅读5页,还剩68页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2用样本估计总体2.2.1用样本的频率分布估计总体分布1.频率分布直方图的画法最大值与最小值小整数左闭右开不小于k的最分组频数累计频数频率合计样本容量11频率/组距各小长方形的面积2.频率分布折线图与总体密度曲线(1)频率分布折线图连接频率分布直方图中各小长方形上端的_____,就得到频率分布折线图.中点(2)总体密度曲线在样本频率分布直方图中,当样本容量逐渐增加,作图时所分的组数增加,_____减小,相应的频率分布折线图会越来越接近于一条光滑曲线,统计中称这条光滑曲线为总体密度曲线.组距3.茎叶图十位个位没有原始信息的损失数据信息记录与表达【点拨】(1)频率分布直方图的优缺点①优点:可以直观、形象地反映样本的分布规律,清楚地看出数据分布的总体趋势.②缺点:从频率分布直方图得不出原始的数据内容,把数据绘制成频率分布直方图后,原有的具体数据信息就抹掉了.(2)频率分布直方图的三个画法技巧①组数的确定方法:设数据总数目为n,一般地,当n≤50时,则分为5~8组;当50<n≤100时,则分为8~12组.②分点数的决定方法:若数据为整数,则分点数据减去0.5;若数据是小数点后一位的数,则分点数据减去0.05,以此类推.③画频率分布直方图小矩形高的方法:假设频数为1的小矩形的高为h,则频数为k的小矩形的高为kh.(3)绘制茎叶图的注意事项①绘制茎叶图的关键是分清茎和叶.一般来说,当数据是两位数时,十位上的数字为“茎”,个位上的数字为“叶”;如果是小数,通常把整数部分作为“茎”,小数部分作为“叶”;②应用茎叶图对两组数据进行比较时,要从数据分布的对称性、中位数、稳定性等方面来比较.提醒:在茎叶图中,相同的数字代表数据的再次出现,切不可忽略.【自我检测】1.从一群学生中抽取一个一定容量的样本,对他们的学习成绩进行分析.已知不超过80分的为10人,其累积频率为0.5,则样本容量是(

)A.20B.40C.80D.60【解析】选A.样本容量==20.2.如图,是一个班的语文成绩的茎叶图(单位:分),则优秀率(90分以上)是________,最低分是________.【解析】由茎叶图知,样本容量为25,90分以上的有1人,故优秀率为

=4%,最低分为51分.答案:4%

513.一个容量为32的样本,分成5组,已知第三组的频率为0.375,则另外四组的频数之和为________.【解析】由题意得,第三组的频数为32×0.375=12.所以另外四组的频数之和为32-12=20.答案:20类型一频率分布表、频率分布直方图、频率分布折线图【典例】1.容量为20的样本数据,分组后的频数如表所示.则样本数据落在区间[10,40)的频率为(

)A.0.35 B.0.45 C.0.55 D.0.65分组[10,20)[20,30)[30,40)[40,50)[50,60)[60,70]频数2345422.山东省教育厅为了了解和掌握2016年高考考生的实际答卷情况,随机地取出了100名考生的数学成绩,数据如下:(单位:分)

135

98

102

110

99

121

110

96

100

103125

97

117

113

110

92

102

109

104

112105

124

87

131

97

102

123

104

104

128109

123

111

103

105

92

114

108

104

102129

126

97

100

115

111

106

117

104

109111

89

110

121

80

120

121

104

108

118129

99

90

99

121

123

107

111

91

10099

101

116

97

102

108

101

95

107

101102

108

117

99

118

106

119

97

126

108123

119

98

121

101

113

102

103

104

108(1)列出频率分布表.(2)画出频率分布直方图和折线图.(3)估计该省考生数学成绩在[100,120)分之间的比例.【审题路线图】1.首先确定[10,40)内的频数,再求频率.2.频率分布直方图⇒先求极差,根据极差与数据个数确定组距、组数,然后画图并分析求解.【解析】1.选B.样本数据落在区间[10,40)的频数为2+3+4=9,故所求的频率为=0.45.2.100个数据中,最大值为135,最小值为80,极差为135-80=55.取组距为5,则组数为=11.(1)频率分布表如下:分组频数频率频率/组距[80,85)10.010.002[85,90)20.020.004[90,95)40.040.008[95,100)140.140.028[100,105)240.240.048[105,110)150.150.030分组频数频率频率/组距[110,115)120.120.024[115,120)90.090.018[120,125)110.110.022[125,130)60.060.012[130,135]20.020.004合计10010.2注:表中加上“频率/组距”一列,这是为画频率分布直方图准备的,因为它是频率分布直方图的纵坐标.(2)根据频率分布表中的有关信息画出频率分布直方图及折线图,如图所示:(3)从频率分布表中可知,这100名考生的数学成绩在[100,120)分之间的频率为0.24+0.15+0.12+0.09=0.60,据此估计该省考生数学成绩在[100,120)分之间的比例为60%.(0.60=60%)【方法技巧】绘制频率分布直方图的注意事项(1)计算极差,需要找出这组数的最大值和最小值,当数据很多时,可选一个数当参照.(2)将一批数据分组,目的是要描述数据分布规律,要根据数据多少来确定分组数目,一般来说,数据越多,分组越多.(3)将数据分组,决定分点时,一般使分点比数据多一位小数,并且把第一组的起点稍微减小一点.(4)列频率分布表时,可通过逐一判断各个数据落在哪个小组内,以“正”字确定各个小组内数据的个数.(5)画频率分布直方图时,纵坐标表示频率与组距的比值,一定不能标成频率.提醒:每个小长方形的面积=组距×=频率.【变式训练】有一容量为200的样本,数据的分组以及各组的频数如下:[-20,-15),7;[-15,-10),11;[-10,-5),15;[-5,0),40;[0,5),49;[5,10),41;[10,15),20;[15,20],17.(1)列出样本的频率分布表.(2)画出频率分布直方图和频率分布折线图.(3)求样本数据不足0的频率.【解析】(1)频率分布表如下:分组频数频率[-20,-15)70.035[-15,-10)110.055[-10,-5)150.075[-5,0)400.2[0,5)490.245[5,10)410.205[10,15)200.1[15,20]170.085合计2001.00(2)频率分布直方图和频率分布折线图如图所示:(3)样本数据不足0的频率为:0.035+0.055+0.075+0.2=0.365.【补偿训练】如图所示是一容量为100的样本的频率分布直方图,则由图形中的数据,样本落在[15,20]内的频数为(

)A.20B.30C.40D.50【解析】选B.样本落在[15,20]内的频率是1-5(0.04+0.1)=0.3,则样本落在[15,20]内的频数为0.3×100=30.类型二茎叶图的画法及应用【典例】1.如图,是某公司10个销售店某月销售某产品数量(单位:台)的茎叶图,则数据落在区间[22,30)内的频率为(

)

A.0.2 B.0.4C.0.5D.0.62.在最新一期《参考消息》和《人民日报》中各取一篇文章,每个句子的字数分别如下:

27,39,33,24,28,19,32,41,33,27,35,12,36,41,27,13,22,23,18,46,32,22.(1)画出两组数据的茎叶图.(2)比较分析两组数据,能得出什么结论?【审题路线图】茎叶图问题⇒结合数据,利用茎叶图的画法,并结合茎叶图进行分析.【解析】1.选B.因为数据总个数n=10,又落在区间[22,30)内的数据个数为4,所以所求的频率为

=0.4.2.(1)依题意,画出茎叶图如图所示:(2)《参考消息》选取的文章中每个句子的字数集中在10~41之间,中位数为32,而《人民日报》文章中每个句子的字数集中在10~46之间,中位数为23.还可以看出,《参考消息》上每个句子的平均字数比《人民日报》上每个句子的平均字数要多.【方法技巧】茎叶图的画法步骤(1)将每个数据分为茎(高位)和叶(低位)两部分.(2)将最小的茎和最大的茎之间的数按从小到大的顺序从上到下列出,茎相同者共用一个茎,再画上竖线作为分界线.(3)将各个数据的叶写在其茎右(左)侧.【变式训练】某中学高二(2)班甲、乙两名学生自进入高中以来,每次数学考试成绩情况如下:甲:95,81,75,91,86,89,71,65,76,88,94,110,107.乙:83,86,93,99,88,103,98,114,98,79,78,106,101.画出两人数学成绩的茎叶图,并根据茎叶图对两人的成绩进行比较.【解析】甲、乙两人数学成绩的茎叶图如图所示:从这个茎叶图上可以看出,乙同学的得分情况是大致对称的,中位数是98;甲同学的得分情况,也大致对称,中位数是88.乙同学的成绩比较稳定,总体情况比甲同学好.【补偿训练】如图,是2016年青年歌手大奖赛中七位评委为甲、乙两名选手打出的分数的茎叶图(图中m为数字0~9中的一个),去掉一个最高分和一个最低分后,甲、乙两名选手得分的平均数分别为a1,a2,则一定有(

)A.a1>a2

B.a2>a1C.a1=a2D.a1,a2的大小与m的值有关【解析】选B.根据茎叶图可知,去掉一个最高分和一个最低分后,甲的平均分为a1=80+=84,乙的平均分为a2=80+=85,故a2>a1.类型三频率分布直方图的应用【典例】1.某公司为了改善职工的出行条件,随机抽取100名职工,调查了他们的居住地与公司间的距离d(单位:km).由其数据绘制的频率分布直方图如图所示,则样本中职工居住地与公司间的距离不超过4km的人数为________.2.为了了解高一学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组频数为12.

(1)第二小组的频率是多少?样本容量是多少?(2)若次数在110以上(含110次)为达标,试估计该学校全体高一学生的达标率是多少?【审题路线图】频率分布直方图⇒频率⇒频数或样本容量⇒答案.【解析】1.不超过4km的频率为(0.1+0.14)×2=0.48,故样本中职工居住地与公司间的距离不超过4km的人数有0.48×100=48(人).答案:482.(1)由于频率分布直方图以面积的形式反映了数据落在各小组内的频率大小,因此第二小组的频率为:=0.08.又因为第二小组的频率=所以样本容量=(2)由题意估计该学校高一学生的达标率约为

×100%=88%.【延伸探究】1.若本例2条件不变,试求样本中不达标的学生人数.【解析】由本例2的解析知达标率为88%,样本容量为150,不达标的学生频率为1-0.88=0.12.所以样本中不达标的学生人数为150×0.12=18(人).2.若本例2条件不变,试求第三小组的频数.【解析】第三小组的频率为

=0.34.又因为样本容量为150.所以第三小组的频数为150×0.34=51.【方法技巧】由频率分布直方图进行相关计算时,需掌握下列关系式.(1)×组距=频率.(2)=频率,此关系式的变形为:=样本容量,样本容量×频率=频数.【补偿训练】某校在5月份开展了科技月活动.在活动中某班举行了小制作评比,规定作品上交的时间为5月1日到31日,逾期不得参加评比.评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图.已知从左到右各长方形的高的比为2∶3∶4∶6∶4∶1,第三组的频数为12,请解答下列问题:(1)本次活动共有多少件作品参加评比?(2)哪组上交的作品数最多,有多少件?(3)经过评比,第四组和第六组分别有10件、2件作品获奖,问这两组哪组获奖率较高?【解析】(1)设从左到右各长方形的高分别为2x,3x,4x,6x,4x,x.设参加评比的作品总数为a件,依题意得:4x×5=满足(2x+3x+4x+6x+4x+x)×5=1,解得a=60(件).(2)由频率分布直方图可以看出第四组上交的作品数量最多,共有6×x

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论