版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
2.2.2用样本的数字特征估计总体的数字特征
三维目标
1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样
本的众数、中位数、平均数估计总体的众数、中位数、平均数,并结
合实际,对问题作出合理判断,制定解决问题的有效方法;初步体会、
领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、
分析、判断,培养学生“实事求是”的科学态度和严谨的工作作风.
2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能
根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字
特征(如平均数、标准差),并作出合理的解释;会用样本的基本数
字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价
的意识.
3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解
数形结合的数学思想和逻辑推理的数学方法;会用随机抽样的方法和
样本估计总体的思想解决一些简单的实际问题,认识统计的作用.
重点难点
教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合
理解释,估计总体的基本数字特征;体会样本数字特征具有随机性.
教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应
用相关知识解决简单的实际问题.
2.2.2用样本的数字特征估计总体的数字特征
学情分析
1初中已经学过众数、中位数、平均数,对本节知识有了一定的了解,
他们对本节课有着较浓厚的兴趣。
2、学生具备一定的模仿、探索能力,合作精神较好。
3、前面已经学习了用样本的频率分布估计总体分布。
4、学生初中已经学过众数、中位数、平均数和前一节学习过的用样
本的频率分布估计总体分布是认知起点。
2.2.2用样本的数字特征估计总体的数字特征同步练习题
一、选择题:
1.关于平均数、中位数、众数的下列说法中正确一个是()
A.中位数可以准确的反映出总体的情况
B.平均数数可以准确的反映出总体的情况
C.众数数可以准确的反映出总体的情况
D.平均数、中位数、众数都有局限性,都不能准确的反映出总体的情况
2.设再=4,/=5,鼻=6,则该样本的标准差为()
V6C叵D业
B.----
3,33
3.一个样本数据从小到大的顺序排列为12,15,20,x,23,28,30,50,其中,中位数为22,
则x=()
A.21B.15C.22D.35
4.甲、乙两名射击运动员,在一次连续10次的射击中,他们所射中环数的平均数一样,
但方差不同,正确评价他们的水平是()
A.因为他们所射中环数的平均数一样,所以他们水平相同;
B.虽然射中环数的平均数一样,但方差较大的,潜力较大,更有发展前途;
C.虽然射中环数的平均数一样,但方差较小的,发挥较稳定,更有发展前途;
D.虽然射中环数的平均数一样,但方差较小的,发挥较不稳定,忽高忽低;
5.已知一组数据为-8,—1,4,X,10,13且这组数的中位数是7,那么数据中的众数是()
A.7B.6C.4D.10
6.一组数据的方差为将这组数据中的每个数据都扩大2倍,所得一组新数据的方
差为()
12
A.s1B.-sC.2s2D.4.v2
2
7.若X是再,尤2,…,西00的平均值,%为尤|,工2,…,匕0的平均值,出为%41,》2,…,再00的
平均值,则下列式子中正确的是()
40。]+60/—60。[+40凡一一a1+
A.K--!-----B.x=--!-----C.x=a,D.x=----
100100-2
二'填空题:
8.数据5,7,7,8,10,11的中位数、众数、平均数分别是
9.若6个数的标准差为2,平均数为1,则此六数的平方和为
后
10.若40个数据的平方和是36,平均数是注,则这组数据的标准差是____
2
11.一组数据的方差为若将该组数据中的每一个数都减去10得到一组新数据,则
23
该组新数据的方差为
三'解答题:
12.甲乙两位同学进行投篮比赛,每人玩5局.每局在指定线外投篮,若第一次不进,再投第
二次,依此类推,但最多只能投6次.当投进时,该局结束,并记下投篮次数.当6投不进,
该局也结束,记为"X”.当第一次投进得6分,第二次投进得5分,第三次投进得4分,
依此类推.第6次不投进,得0分.两人投篮情况如下:
第1局第2局第3局第4局第5局
甲5次X4次5次1次
乙X2次4次2次X
请通过计算,判断那个投篮的水平高?
参考答案
一选择题:
1.D2.B3.A4.C5.D6.D7.A
答案提示:
1.根据平均数、中位数、众数的定义可知答案为(D);
2_V6
2.由x=5得s=§[(斗—x)2+(x—x)2+(x—x)2]=
233-V
3.因为共有八个数,因此,当按从小到大的顺序排列后,中位数等于最中间两数的平均
数.
4.由平均数与方差的概念即知;
5.因为共有六个数,因此,当按从小到大的顺序排列后,中位数等于最中间两数的平均
数,因此,x=10:
4+辛八十2(玉一X)+(X—X)+•••+(X-X),
6rh.由方差公式s'=---------=2----------------------分析即可;
n
7.由于2+%H-FX100=X,而无]+%+…+工40=40%,
-40。1+60d
!
x41+x2+•••+x100=60«2,于是,x=----------
100
二、填空题:
Vlo1
8.—,7、89.3010.——11.——
2523
答案提示:
8.中位数为”.观察数据5,7,7,8,10,11可知众数为“7”、中位数为“上百”通过计算
22
得不均数为“8”;
222
9.由S=F(X|-x)+(x2-x)-i----i-(x6-x)]=+X;-I----龙
即2=K(X:+xl+---+xl)-l由此即得结论;
10.S=~X)2+(x2~X)2T----卜(%40-X)2]=
舟:+x"..+“2(…2;0一+汕+7
11.由方差计算公式易得.
三、解答题:
12.解:依题意,甲乙得分情况如下表:
第一局第二局第三局第四局第五局
甲20326
乙05350
因为:甲得分平均数=2.6,乙得分平均数=2.6,
甲得分的标准差=1.96,乙得分的标准差=2.24
所以:甲得分平均数=乙得分平均数
甲得分的标准差〈乙得分的标准差
故甲投篮的水平高.
《2.2.2用样本的数字特征估计总体的数字特征》评课
孙老师的这节课思路清晰,环节紧凑,重难点突出,设计合理,引导的也很到位,充
分体现了学生的主体和教师的主导作用。
1.首先,教学目标明确、具体,问题设计层次性强,符合学生的认知规律。在整节课
的学习过程中,始终围绕着学习目标展开,五个环节,循序渐进,层层相扣,步步加
深。
2.其次,随着本节课的进行,完全贯彻现代教学要求,以学生为主体,教师引导,学
生真正体会到了主动学习的乐趣,改变了以往教学的传统教师讲、学生听的一贯模式。
采取多种教学手段,帮助学生掌握学习方法,能够创造性的运用教材,以问题为中心,
以学生自主、合作、探究为主要教学方式把学习的主动权交给学生,让学生在自学中
进行独立思考,鼓励学生发表自己的意见,与同伴交流,并充分给足学生思考、交流、
合作的时间和空间。其中给我印象最深的是小组讨论,学生积极参与,回答问题大胆
主动。本节课一共包含五次小组讨论,时间15分钟左右,设置的恰到好处。特别是第
四次关于大学生就业工资问题的讨论,由于问题贴近实际,学生感兴趣,一下子调动
了学生的兴趣与积极性。
3.在最后小结的时候,学生先试着独立总结出自己本节课的收获,彼此分享,其他同
学补充,最后教师引导归纳,通过小结,教师也可以看出学生对本节课内容的掌握情
况。
个人感觉不足之处是本节课教师与学生都感觉比较紧张,语言个别不是很精练。但是
总的来说,本节课还是比较成功的,以学生所喜欢的乐于接受的自主学习方式,80%
同学能达到大纲的学习要求。
2.2.2用样本的数字特征估计总体的数字特征
教学内容分析
教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位
数和平均数的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能
够发现,在日常生活中某些人通过混用这些(描述平均位置的)统计术语进行误
导.另一方面,教科书通过思考栏目让学生注意到,直接通过样本计算所得到的中
位数与通过频率直方图估计得到的中位数不同.在得到这个结论后,教师可以举
一反三,使学生思考对于众数和平均数,是否也有类似的结论.进一步,可以解释
对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样本
数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体
的中位数、均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见
到的频数表或频率表,用教科书中的方法也可以得到总体的中位数、均值和众数
的估计.
教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征
是不够的,还需要描述样本数据离散程度的特征.通过对如何描述数据离散程度
的探索,使学生体验创造性思维的过程.教科书通过例题向学生展示如何用样本
数字特征解决实际问题,通过阅读与思考栏目“生产过程中的质量控制图”,让
学生进一步体会分布的数字特征在实际中的应用.
2.2.2用样本的数字特征估计总体的数字特征
整体设计
教学分析
教科书结合实例展示了频率分布的众数、中位数和平均数.对于众数、中位数和平均数
的概念,重点放在比较它们的特点,以及它们的适用场合上,使学生能够发现,在日常生活中某
些人通过混用这些(描述平均位置的)统计术语进行误导.另一方面,教科书通过思考栏目让
学生注意到,直接通过样本计算所得到的中位数与通过频率直方图估计得到的中位数不同.在
得到这个结论后,教师可以举一反三,使学生思考对于众数和平均数,是否也有类似的结论.进
一步,可以解释对总体众数、总体中位数和总体平均数的两种不同估计方法的特点.在知道样
本数据的具体数值时,通常通过样本计算中位数、平均值和众数,并用它们估计总体的中位数、
均值和众数.但有时我们得到的数据是整理过的数据,比如在媒体中见到的频数表或频率表,
用教科书中的方法也可以得到总体的中位数、均值和众数的估计.
教科书通过几个现实生活的例子,引导学生认识到:只描述平均位置的特征是不够的,还
需要描述样本数据离散程度的特征.通过对如何描述数据离散程度的探索,使学生体验创造性
思维的过程.教科书通过例题向学生展示如何用样本数字特征解决实际问题,通过阅读与思考
栏目“生产过程中的质量控制图”,让学生进一步体会分布的数字特征在实际中的应用.
三维目标
1.能利用频率分布直方图估计总体的众数、中位数、平均数;能用样本的众数、中位数、平
均数估计总体的众数、中位数、平均数,并结合实际,对问题作出合理判断,制定解决问题的有
效方法;初步体会、领悟“用数据说话”的统计思想方法;通过对有关数据的搜集、整理、分
析、判断,培养学生“实事求是''的科学态度和严谨的工作作风.
2.正确理解样本数据标准差的意义和作用,学会计算数据的标准差;能根据实际问题的需要合
理地选取样本,从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释;
会用样本的基本数字特征估计总体的基本数字特征,形成对数据处理过程进行初步评价的意
识.
3.在解决统计问题的过程中,进一步体会用样本估计总体的思想,理解数形结合的数学思想和
逻辑推理的数学方法;会用随机抽样的方法和样本估计总体的思想解决一些简单的实际问题,
认识统计的作用,能够辨证地理解数学知识与现实世界的联系.
重点难点
教学重点:根据实际问题对样本数据中提取基本的数据特征并作出合理解释,估计总体的基
本数字特征;体会样本数字特征具有随机性.
教学难点:用样本平均数和标准差估计总体的平均数与标准差;能应用相关知识解决简单的
实际问题.
课时安排
2课时
教学过程
第1课时众数、中位数、平均数
导入新课
思路1
在一次射击比赛中,甲、乙两名运动员各射击10次,命中环数如下:
甲运动员:7,8,6,8,6,5,8,10,7,4;
乙运动员95,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?为了从整体上更好地把握
总体的规律,我们要通过样本的数据对总体的数字特征进行研究.——用样本的数字特征估计
总体的数字特征.(板书课题)
思路2
在日常生活中,我们往往并不需要了解总体的分布形态,而是更关心总体的某一数字特征,
例如:买灯泡时,我们希望知道灯泡的平均使用寿命,我们怎样了解灯泡的使用寿命呢?当然
不能把所有灯泡一一测试,因为测试后灯泡则报废了.于是,需要通过随机抽样,把这批灯泡的
寿命看作总体,从中随机取出若干个个体作为样本,算出样本的数字特征,用样本的数字特征
来估计总体的数字特征.
推进新课
新知探究
提出问题
(1)什么是众数、中位数、平均数?
(1)如何绘制频率分布直方图?
(3)如何从频率分布直方图中估计众数、中位数、平均数?
活动:那么学生回忆初中所学的一些统计知识,思考后展开讨论,教师提示引导.
讨论结果:
(1)初中我们曾经学过众数(在一组数据中,出现次数最多的数称为众数)、中位数(在按大小
顺序排列的一组数据中,居于中间的数称为中位数)、平均数(一般是一组数据和的算术平均
数)等各种数字特征,应当说,这些数字都能够为我们提供关于样本数据的特征信息.
(2)画频率分布直方图的一般步骤为:计算一组数据中最大值与最小值的差,即求极差;决定
组距与组数;将数据分组;列频率分布表:画频率分布直方图.
(3)教材前面一节在调查100位居民的月均用水量的问题中,从这些样本数据的频率分布直方
图可以看出,月均用水量的众数是2.25t(最高的矩形的中点),它告诉我们,该市的月均用水
量为2.25t的居民数比月均用水量为其他值的居民数多,但它并没有告诉我们到底多多少.
请大家翻回到课本看看原来抽样的数据,有没有2.25这个数值呢?根据众数的定
义225怎么会是众数呢?为什么?(请大家思考作答)
分析:这是因为样本数据的频率分布直方图把原始的一些数据给遗失了,而2.25是由样本数
据的频率分布直方图得来的,所以存在一些偏差.
提问:那么如何从频率分布直方图中估计中位数呢?
分析:在样本数据中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数.
因此,在频率分布直方图中,矩形的面积大小正好表示频率的大小,即中位数左边和右边的直
方图的面积应该相等屈此可以估计出中位数的值为2.02.
思考:2.02这个中位数的估计值,与样本的中位数值2.0不一样,你能解释其中的原因吗?(原
因同上:样本数据的频率分布直方图把原始的一些数据给遗失了)
课本显示,大部分居民的月均用水量在中部(2.02t左右),但是也有少数居民的月均用水
量特别高,显然,对这部分居民的用水量作出限制是非常合理的.
思考:中位数不受少数儿个极端值的影响,这在某些情况下是一个优点,但是它对极端值的不
敏感有时也会成为缺点,你能举例说明吗?(让学生讨论,并举例)
对极端值不敏感有利的例子:考察课本中表21中的数据,如果把最后一个数据错写成22,
并不会对样本中位数产生影响.也就是说对极端数据不敏感的方法能够有效地预防错误数据
的影响,而在实际应用中,人为操作的失误经常造成错误数据.
对极端值不敏感有弊的例子:某人具有初级计算机专业技术水平,想找一份收入好的工作,
这时如果采用各个公司计算机专业技术人员收入的中位数作为选择工作的参考指标就会冒
这样的风险:很可能所选择公司的初级计算机专业技术水平人员的收入很低,其原因是中位数
对极小的数据不敏感.这里更好的方法是同时用平均工资和中位数来作为参考指标,选择平均
工资较高且中位数较大的公司就业.对极端值不敏感的方法,不能反映数据中的极端情况.
同样的,可以从频率分布直方图中估计平均数,上图就显示了居民用水的平均数,它等于
频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.由估计可知,居民的
月均用水量的平均值为2.02t.
显示了居民月均用水量的平均数,它是频率分布直方图的“重心由于平均数与每一个样
本数据有关,所以,任何一个样本数据的改变都会引起平均数的改变.这是中位数、众数都不具
有的性质.也正因为这个原因,与众数、中位数比较起来,平均数可以反映出更多的关于样本数
据全体的信息.从图上可以看出,用水量最多的几个居民对平均数影响较大,这是因为他们的
月均用水量与平均数相差太多了.
利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
总之,众数、中位数、平均数都是对数据中心位置的描述,可以作为总体相应特征的估计.样本
众数易计算,但只能表达样本数据中的很少一部分信息,不一定唯一;中位数仅利用了数据中
排在中间数据的信息,与数据的排列位置有关;平均数受样本中的每一个数据的影响,绝对值
越大的数据,对平均数的影响也越大.三者相比,平均数代表了数据更多的信息,描述了数据的
平均水平,是一组数据的“重心
应用示例
思路1
例1(1)若M个数的平均数是X.N个数的平均数是Y,则这M+N个数的平均数是
(2)如果两组数xi,X2,…,X.和yily2,...,yn的样本平均数分别是x和y,那么一组数
X1+y1,X2+y2,…,Xn+yn的平均数是.
活动:学生思考或交流,教师提示,根据平均数的定义得到结论.
M+N
x+y
2
例2某校高一年级的甲、乙两个班级(均为50人)的语文测试成绩如下(总分:150分)
试确定这次考试中,哪个班的语文成绩更好一些.
甲班:
11286106841001059810294107
87112949499901209895119
1081009611511110495108111105
104107119107931029811211299
92102938494941009084114
乙班:
11695109961069810899110103
949810510111510411210111396
108100110981078710810610397
10710611112197107114122101107
10711111410610410495111111110
分析:我们可用一组数据的平均数衡量这组数据的集中水平,因此,分别求出甲、乙两个班的
平均分即可.
解:用计算器分别求出甲班的平均分为101.1,乙班的平均分为105.4,故这次考试乙班成绩要
好于甲班.
思路2
例1下面是某校学生日睡眠时间抽样频率分布表(单位:h),试估计该校学生的日平均睡眠
时间.
睡眠时间人数频率
[6,6.5)50.05
[6.5,7)170.17
[7,7.5)330.33
[7.5,8)370.37
[8,8.5)60.06
[8.5,9)20.02
合计1001
分析:要确定这100名学生的平均睡眠时间,就必须计算其总睡眠时间,由于每组中的个体睡
眠时间只是一个范围,可以用各组区间的组中值近似地表示.
解法一:总睡眠时间约为
6.25x5+6.75x17+7.25x33+7.75x37+8.25x6+8.75x2=739(h),
故平均睡眠时间约为7.39h.
解法二:求组中值与对应频率之积的和
6.25x0.05+6.75x0.17+7.25x0.33+7.75x0.37+8.25x0.06+8.75x0.02=7.39(h).
答:估计该校学生的日平均睡眠时间约为7.39h.
例2某单位年收入在10000至I」15000、15000至U20000、20000至U25000、25000至U30000、
30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为
10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入.
分析:上述百分比就是各组的频率.
解:估计该单位职工的平均年收入为
12500x10%+17500x15%+22500x20%+27500x25%+32500x15%+37500x10%+45
000x5%=26125(元).
答:估计该单位人均年收入约为26125元.
知能训练
从甲、乙两个公司各随机抽取50名员工月工资:
甲公司:
8008008008008001000100010001000
100010001000100010001000120012001200
120012001200120012001200120012001200
120012001200120012001200120012001500
150015001500150015001500200020002000
20002000250025002500
乙公司:
700700700700700700700700700
700700700700700700100010001000
100010001000100010001000100010001000
100010001000100010001000100010001000
100010001000100010001000100010001000
100010006000800010000
试计算这两个公司50名员工月工资平均数、众数、中位数,并估计这两个企业员工平均工资.
答案:甲公司:员工月工资平均数1240,众数1200,中位数1200;
乙公司:员工月工资平均数1330,众数1000,中位数1000;从总体上看乙公司员工月工资比
甲公司少,原因是乙公司有几个收入特高的员工影响了工资平均数.
拓展提升
“用数据说话“,这是我们经常可以听到的一句话.但是,数据有时也会被利用,从而产生误
导.例如,一个企业中,绝大多数是一线工人,他们的年收入可能是一万元左右,另有一些经理层
次的人,年收入可以达到几十万元.这时,年收入的平均数会比中位数大得多.尽管这时中位数
比平均数更合理些,但是这个企业的老板到人力市场去招聘工人时,也许更可能用平均数来回
答有关工资待遇方面的提问.
你认为“我们单位的收入水平比别的单位高''这句话应当怎么解释?
这句话的目的是谨防利用人们对统计术语的模糊认识进行误导(蒙骗).使学生能够正确
理解在日常生活中像“我们单位的收入水平比别的单位高''这类话的模糊性,这里的“收入水
平”是指员工收入数据的某个中心点,即可以是中位数、平均数或众数,不同的解释有不同的含
义.
在这里应该注意以下几点:
1.样本众数通常用来表示分类变量的中心值,容易计算,但是它只能表达样本数据中的很少一
部分信息,通常用于描述分类变量的中心位置.
2.中位数不受少数几个极端数据(即排序靠前或排序靠后的数据)的影响,容易计算,它仅利用
了数据中排在中间数据的信息.当样本数据质量比较差,即存在一些错误数据(如数据的录入
错误、测量错误等)时,应该用抗极端数据强的中位数表示数据的中心值,可以利用计算机模拟
样本,向学生展示错误数据对样本中位数的影响程度.
3.平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大.与众数和中
位数相比,平均数代表了数据更多的信息.当样本数据质量比较差时,使用平均数描述数据的
中心位置可能与实际情况产生较大的误差.可以利用计算机模拟样本,向学生展示错误数据对
样本平均数的影响程度.在体育、文艺等各种比赛的评分中,使用的是平均数.计分过程中采用
“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素而给出过高或
过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性.
4.如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在
许多较小的极端值.在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解
样本数据中极端数据的信息,帮助我们作出决策.
5.使用者常根据自己的利益去选取使用中位数或平均数来描述数据的中心位置,从而产生一
些误导作用.
课堂小结
1.能根据实际问题的需要合理地选取样本,从样本数据中提取基本的数字特征(平均数),
会用样本的基本数字特征估计总体的基本数字特征;
2.平均数对数据有“取齐”的作用,代表一组数据的平均水平;
3.形成对数据处理过程进行初步评价的意识.
作业
习题2.2A组3.
设计感想
本堂课在初中学习的众数、中位数、平均数的基础上,学习了利用频率分布直方图估计
众数、中位数、平均数,这是一种近似估计,但都能说明总体的分布特征,各有优缺点,讲解时紧
扣课本内容,讲清讲透,使学生活学活用,会画频率分布直方图,会利用频率分布直方图估计众
数、中位数、平均数,对总体作出正确的估计.
(设计者:路波)
第2课时标准差
导入新课
思路1
平均数为我们提供了样本数据的重要信息,但是,有时平均数也会使我们作出对总体的片
面判断.某地区的统计显示,该地区的中学生的平均身高为176cm,给我们的印象是该地区的
中学生生长发育好,身高较高.但是,假如这个平均数是从五十万名中学生抽出的五十名身高
较高的学生计算出来的话,那么,这个平均数就不能代表该地区所有中学生的身体素质.因此,
只有平均数难以概括样本数据的实际状态.所以我们学习从另外的角度来考察样本数据的统
计量——标准差.(教师板书课题)
思路2
在一次射击选拔比赛中,甲、乙两名运动员各射击10次,命中环数如下:
甲运动员:7,8,7,9,5,4,9,10,7,4;
乙运动员95,7,8,7,6,8,6,7,7.
观察上述样本数据,你能判断哪个运动员发挥得更稳定些吗?如果你是教练,选哪位选手
去参加正式比赛?
我们知道,x甲=7,x4=7.两个人射击的平均成绩是一样的.那么,是否两个人就没有水平差
距呢?
从上图直观上看,还是有差异的.很明显,甲的成绩比较分散,乙的成绩相对集中,因此我们
从另外的角度来考察这两组数据——标准差.
推进新课
新知探究
提出问题
(1)如何通过频率分布直方图估计数字特征(中位数、众数、平均数)?
(2)有甲、乙两种钢筋,现从中各抽取一个标本(如下表)检查它们的抗拉强度(单位:kg/mm2),
通过计算发现,两个样本的平均数均为125.
甲110120130125120125135125135125
乙115100125130115125125145125145
哪种钢筋的质量较好?
(3)某种子公司为了在当地推行两种新水稻品种,对甲、乙两种水稻进行了连续7年的种植对
比实验,年亩产量分别如下:(千克)
甲:600,880,880,620,960,570,900(平均773)
乙:800,860,850,750,750,800,700(平均787)
请你用所学统计学的知识,说明选择哪种品种推广更好?
(4)全面建设小康社会是我们党和政府的工作重心,某市按当地物价水平计算,人均年收入达
到1.5万元的家庭即达到小康生活水平.民政局对该市100户家庭进行调查统计,它们的人均
收入达到了1.6万元,民政局即宣布该市民生活水平已达到小康水平,你认为这样的结论是否
符合实际?
(5)如何考查样本数据的分散程度的大小呢?把数据在坐标系中刻画出来,是否能直观地判断
数据的离散程度?
讨论结果:
(1)利用频率分布直方图估计众数、中位数、平均数:
估计众数:频率分布直方图面积最大的方条的横轴中点数字.(最高矩形的中点)
估计中位数:中位数把频率分布直方图分成左右两边面积相等.
估计平均数:频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之和.
(2)
105110115120125130135140
----------极差----------/甲
---------------------极差--------------------1
「…丁…।
100105110115120125130135140145
由上图可以看出,乙样本的最小值100低于甲样本的最小值110,乙样本的最大值145高
于甲样本的最大值135,这说明乙种钢筋没有甲种钢筋的抗拉强度稳定.
我们把一组数据的最大值与最小值的差称为极差(range).由上图可以看出,乙的极差较
大,数据点较分散;甲的极差小,数据点较集中,这说明甲比乙稳定.运用极差对两组数据进行比
较,操作简单方便,但如果两组数据的集中程度差异不大时,就不容易得出结论.
(3)选择的依据应该是,产量高且稳产的品种,所以选择乙更为合理.
(4)不符合实际.
样本太小,没有代表性.若样本里有个别高收入者与多数低收入者差别太大.在统计学里,
对统计数据的分析,需要结合实际,侧重于考察总体的相关数据特征.比如,市民平均收入问题,
都是考察数据的分散程度.
(5)把问题(3)中的数据在坐标系中刻画出来.我们可以很直观地知道,乙组数据比甲组数据更
集中在平均数的附近,即乙的分散程度小,如何用数字去刻画这种分散程度呢?考察样本数
据的分散程度的大小,最常用的统计量是方差和标准差.
标准差:
考察样本数据的分散程度的大小,最常用的统计量是标准差(standarddeviation).标准差是
样本数据到平均数的一种平均距离,一般用s表示.
所谓“平均距离'',其含义可作如下理解:
假设样本数据是X1,X2”..,Xn,x表示这组数据的平均数凶到x的距离是|x『x|(i=l,2,...,n).
十|%2—X|+•+|x“一元|
于是,样本数据X|,X2,…,Xn到元的“平均距离''是
n
由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差:
S=J~K*VXI一无产+(%2一元)2+---一5)2].
Vn
意义:标准差用来表示稳定性,标准差越大,数据的离散程度就越大,也就越不稳定.标准差越小,
数据的离散程度就越小,也就越稳定.从标准差的定义可以看出,标准差SK),当s=0时,意味着所
有的样本数据都等于样本平均数.
标准差还可以用于对样本数据的另外一种解释.例如,
在关于居民月均用水量的例子中,平均数元=1.973,标准差s=0.868,所以
X+s=2.841,x+2s=3.709;
x-s=1.105,x-2s=0.237.
这100个数据中,在区间[元-2s,±+2s]=[0.237,3.709]外的只有4个,也就是说,
[x-2s,x+2s]几乎包含了所有样本数据.
从数学的角度考虑,人们有时用标准差的平方S2——方差来代替标准差,作为测量样本
数据分散程度的工具:
2:222
s=—L(X|-X)+(X2-X)+...+(Xn-X)].
n
显然,在刻画样本数据的离散程度上,方差与标准差是一样的.但在解决实际问题时,一般
多采用标准差.
需要指出的是,现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不
知道的.如何求得总体的平均数和标准差呢?通常的做法是用样本的平均数和标准差去估计
总体的平均数与标准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要样
本的代表性好,这样做就是合理的,也是可以接受的.
两者都是描述一组数据围绕平均数波动的大小,实际应用中比较广泛的是标准差.如导入
中的运动员成绩的标准差的计算器计算.
用计算器计算运动员甲的成绩的标准差的过程如下:
[MODE]田(进入统计计算模式)
[SHIFT][CLR]0日(清除统计存储器)
7[ot]8[DT]7[ot]95[DT]
4®9®10®7®4®
SHIFT][S-VAR)QQ(计算样本标准差)
2
即S甲=2.
用类似的方法,可得s乙A.095.
由sv>sz可以知道,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击
成绩稳定.
应用示例
思路1
例1画出下列四组样本数据的条形图,说明它们的异同点.
(1)5,5,5,5,5,5,5,5,5;
(2)44,4.5,5,5,6,6,6;
(3)3,3,4,4,5,667,7;
(4)22,2,2,5,8,8,8,8.
分析:先画出数据的条形图,根据样本数据算出样本数据的平均数,利用标准差的计算公式即
可算出每一组数据的标准差.
解:四组样本数据的条形图如下:
四组数据的平均数都是5.0,标准差分别是:0.00,0.82,1.49,2.83.
它们有相同的平均数,但它们有不同的标准差,说明数据的分散程度是不一样的.
例2甲、乙两人同时生产内径为25.40mm的一种零件.为了对两人的生产质量进行评比,
从他们生产的零件中各抽出20件,量得其内径尺寸如下(单位:mm):
甲
25.4625.3225.4525.3925.36
25.3425.4225.4525.3825.42
25.3925.4325.3925.4025.44
25.4025.4225.3525.4125.39
乙
25.4025.4325.4425.4825.48
25.4725.4925.4925.3625.34
25.3325.4325.4325.3225.47
25.3125.3225.3225.3225.48
从生产的零件内径的尺寸看,谁生产的质量较高?
分析:每一个工人生产的所有零件的内径尺寸组成一个总体.由于零件的生产标准已经给出
(内径25.40mm),生产质量可以从总体的平均数与标准差两个角度来衡量.总体的平均数与内
径标准尺寸25.40mm的差异大时质量低,差异小时质量高;当总体的平均数与标准尺寸很接
近时,总体的标准差小的时候质量高,标准差大的时候质量低.这样,比较两人的生产质量,只要
比较他们所生产的零件内径尺寸所组成的两个总体的平均数与标准差的大小即可.但是,这两
个总体的平均数与标准差都是不知道的,根据用样本估计总体的思想,我们可以通过抽样分别
获得相应的样本数据,然后比较这两个样本的平均数、标准差,以此作为两个总体之间差异的
估计值.
解:用计算器计算可得
元甲之25.401,-25.406;
s20.037,s^-0.068.
从样本平均数看,甲生产的零件内径比乙的更接近内径标准(25.40mm),但是差异很小;从样本
标准差看,由于s单<s乙,因此甲生产的零件内径比乙的稳定程度高得多.于是,可以作出判断,甲
生产的零件的质量比乙的高一些.
点评:从上述例子我们可以看到,对一名工人生产的零件内径(总体)的质量判断,与所抽取的
零件内径(样本数据)直接相关.显然,我们可以从这名工人生产的零件中获取许多样本.这样,
尽管总体是同一个,但由于样本不同,相应的样本频率分布与平均数、标准差等都会发生改变,
这就会影响到我们对总体情况的估计.如果样本的代表性差,那么对总体所作出的估计就会产
生偏差;样本没有代表性时,对总体作出错误估计的可能性就非常大.这也正是我们在前面讲
随机抽样时反复强调样本代表性的理由.在实际操作中,为了减少错误的发生,条件许可时,通
常采取适当增加样本容量的方法.当然,关键还是要改进抽样方法,提高样本的代表性.
变式训练
某地区全体九年级的3000名学生参加了一次科学测试,为了估计学生的成绩,从不同学
校的不同程度的学生中抽取了100名学生的成绩如下:
100分12人,90分30人,80分18人,70分24人,60分12人,50分4人.
请根据以上数据估计该地区3000名学生的平均分、合格率(60或60分以上均属合格).
解:运用计算器计算得:
100x12+90x30+80x18+70x24+60x12+50x4
=79.40,
100
(12+30+18+24+12)+100=96%,
所以样本的平均分是79.40分,合格率是96%,由此来估计总体3000名学生的平均分是79.40
分,合格率是96%.
思路2
例1甲、乙两种水稻试验品种连续5年的平均单位面积产量如下(单位:t/hm2),试根据
这组数据估计哪一种水稻品种的产量比较稳定.
品种第1年第2年第3年第4年第5年
甲9.89.910.11010.2
乙9.410.310.89.79.8
解:甲品种的力样本平均数为10,样本方差为
[(9.8-10)2+(9.9-10)2+(10.1-10)2+(10-10)2+(10.2-10)2]4-5=0.02.
乙品种的样本平均数也为10,样本方差为
[(9.4-10)2+(10.3-10)2+(10.8-10)2+(9.7-10)2+(9.8-10)2]-5=0.24.
因为0.24>0.02,所以,由这组数据可以认为甲种水稻的产量比较稳定.
例2为了保护学生的视力,教室内的日光灯在使用一段时间后必须更换.已知某校使用的
100只日光灯在必须换掉前的使用天数如下,试估计这种日光灯的平均使用寿命和标准差.
151—18181—21211—24241—27271—30301—33331—36361—39
天数
00000000
灯泡数1111820251672
分析:用每一区间内的组中值作为相应日光灯的使用寿命,再求平均寿命.
解:各组中值分别为165,195,225,255,285,315,345,375,由此算得平均数约为165xl%+195
xll%+225xl8%+255x20%+285x25%+315xl6%+345x7%+375x2%=267.X268(天).
这些组中值的方差为看x[1x(165-268)2+11x(195-268)2+18x(225-268)2+20x(255-268)2+
25X(285-268>+16X(315-268)2+7X(345-268)2+2X(375-268)2]=2128.60(天2).
故所求的标准差约J2128.6E6(天).
答:估计这种日光灯的平均使用寿命约为268天,标准差约为46天.
知能训练
(1)在一次歌手大奖赛上,七位评委为歌手打出的分数如下:9.4,8.4,9.4,9.9,9.6,9.4,9.7,去掉
一个最高分和一个最低分后,所剩数据的平均值和方差分别为.
(2)若给定一组数据X1,X2,…,Xn,方差为s2,则aX|,aX2,…,aXn的方差是.
(3)在相同条件下对自行车运动员甲、乙两人进行了6次测试,测得他们的最大速度(单位:m/s)
的数据如下:
甲273830373531
乙332938342836
试判断选谁参加某项重大比赛更合适?
答案:(1)9.5,0.016(2)a2s2
⑶元甲=33,元乙=33,
乙的成绩比甲稳定,应选乙参加比赛更合适.
拓展提升
某养鱼专业户在一个养鱼池放入一批鱼苗,一年以后准备出售,为了在出售以前估计卖掉
鱼后有多少收入,这个专业户已经了解到市场的销售价是每千克15元,请问,这个专业户还应
该了解什么?怎样去了解?请你为他设计一个方案.
解:这个专业户应了解鱼的总重量,可以先捕出一些鱼(设有x条),作上标记后放回鱼塘,
过一段时间再捕出一些鱼(设有a条),观察其中带有标记的鱼的条数,作为一个样本来估计
总体,则
。条鱼中带有标记的条数=鱼塘中所有带有标记的鱼的条数(x)
«=鱼塘中鱼的总条数
这样就可以求得总条数,同时把第二次捕出的鱼的平均重量求出来,就可以估计鱼塘中的
平均重量,进而估计全部鱼的重量,最后估计出收入.
课堂小结
1.用样本的数字特征估计总体的数字特征分两类:
用样本平均数估计总体平均数,平均数对数据有“取齐”的作用,代表一组数据的平均水
平.
用样本标准差估计总体标准差.样本容量越大,估计就越精确,标准差描述一组数据围绕
平均数波动的大小,反映了一组数据变化的幅度.
2.用样本估计总体的两个手段(用样本的频率分布估计总体的分布;用样本的数字特征估计
总体的数字特征),需要从总体中抽取一个质量较高的样本,才能不会产生较大的估计偏差,
且样本容量越大,估计的结果也就越精确.
作业
习题2.2A组4、5、6、7,B组1、2.
设计感想
统计学科,最大的特点就是与现实生活的密切联系,也是新教材的亮点.仅仅想借助“死记
硬背一些概念及公式,简单模仿课本例题”来学习,是绝对不行的.用样本估计总体时,如果抽样
的方法比较合理,那么样本可以反映总体的信息,但从样本得到的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 江苏省盐城市东台市2024-2025学年九年级上学期11月期中调研化学试题(含答案)
- 天津面试模拟58
- 浙江申论模拟140
- 福建公务员面试模拟121
- 2020年黑龙江申论真题(乡镇类)
- 黑龙江公务员面试模拟23
- 教科版四年级品德与社会下册教案
- 二年级上书法教案
- 2015年6月28日下午内蒙古公务员面试真题
- 江苏公共基础知识C类模拟23
- 施工监测报告(共2页)
- QHNJM07-2020低平板半挂车使用说明书
- 人员素质辞典(通用类)
- 论《史记_陈涉世家》中陈胜的英雄形象
- 无刷直流电机绕组(共30页)
- 碘过敏不良反应应急预案及操作流程
- 贝多芬《钢琴三重奏》演奏探究
- 装饰工程公司架构与职责
- 发电厂电气部分煤矸石电厂厂用电课程设计
- 小学毕业班教学质量目标管理责任书
- 无违约证明的公司承诺函
评论
0/150
提交评论