《总体离散程度的估计》教学设计、导学案、同步练习_第1页
《总体离散程度的估计》教学设计、导学案、同步练习_第2页
《总体离散程度的估计》教学设计、导学案、同步练习_第3页
《总体离散程度的估计》教学设计、导学案、同步练习_第4页
《总体离散程度的估计》教学设计、导学案、同步练习_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《9.2.4总体离散程度的估计》教学设计

【教材分析】

本节《普通高中课程标准数学教科书-必修二(人教A版)第九章《9.2.4总体离散程

度的估计》,本节课通过对反映样本数据离散程度的估计量;极差、方差与标准差的回顾,

进一步研究和学习用样本的数字特征估计总体的数字特征以及初步应用,有利于进一步完善

对统,计学认识的系统性,加深对统计学思想方法的理解。从而发展学生的直观想象、逻辑

推理、数学建模的核心素养。

【教学目标与核心素养】

课程目标学科素养

A.会用样本的极差、方差与标准差估计总1.数学建模:在具体情境中运用极差、方差与标准差

体22.逻辑推理:运用极差、方差与标准差进行推断

B.通过用样本的数字特征估计总体的数3.数学运算:极差、方差与标准差的计算

字特征的研究,渗透统计学的思想和方法。4.数据分析:运用极差、方差与标准差分析判断

C.培养学生收集数据、分析数.据、归纳和

整理数据,增强学习的积极性。

【教学重点】:方差、标准差的计算方法。

【教学难点】:如何利用样本的方差、标准差对总体数据作出分析及判断数据的稳定性。

【教学过程】

教学过程教学设计意图

一、温故知新

(1)众数

皈义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样

本数据)称为这组数据的众数.

②特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据由回顾知识出发,提出问

的集中趋势.题,让学生感受到对反映

(2)中位数样本数字离散程度的估

陵义:一组数据按从小到大(或从大到小)的顺序排成一歹U,处于最中间计量;极差、方差与标准

的一个数据(当数据个数是奇数时)或最中间两个数据的平均数(当数据差学习的重要性。发展学

个数是偶数时)称为这组数据的中位数.生数学抽象、直观想象和

②特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在逻辑推理的核心素养。

频率分布直方图中,中位数左边和右边的直方图的面积相等.

(3)平均数

四义:一组数据的和与这组数据的个数的商.数据x,x,…,x的平均数

12n

为=…+…+0

nn

②恃征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任

何一个数据的改变都会引起平均数的变化,这是众数和中位数都不具有

的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样

本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估

计总体时的可靠性降低.

1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

2、利用频率分布直方图(频率分布表),求样本的平均数、中位数和众

数的近似估计,进而估计总体的平均数、中位数和众数.

2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于

或等于中位数,

因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相

等,由此可以

估计中位数的值。

3、平均数是频率分布直方图的“重心”.是直方图的平衡点.频率直方图

中每个小长

方形的面积乘以小矩形底边中点的横坐标之和。

三种数字特征的优缺点

名称优点缺点

现;只能表达样本数据中很

①体现了样本数据的最

众数少的一部分信息;至死法客观

大集中点;彝易得到

地反映总体特征

①不受少数几个极端数

据,即排序靠前或靠后

中位数的几个数据的影响;②对极端值不敏感

容易得到,便于利用中

间数据的信息

任何一个数据的改变都会引

能反映出更多关于样本

平均数起平均数的改变,数据越“离

数据全体的信息

群”,对平均数的影响越大

二、情境与问题

样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中

众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本

数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数

据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差

通过具体问题,让学生感

时.,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况

受反映样本数字离散程

产生较大的误差,难以反映样本数据的实际状况,很多时候还不能使我

度的估计量;极差、方差

们做出有效决策.因此,我们需要一个统计数字刻画样本数据的离散

与标准差学学习解决实

程度.

际问题中的运用,发展学

方差、标准差

生数学抽象、逻辑推理的

1.思考

核心素养。

(1)平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使

我们作出对总体的片面判断,因为这个平均数掩盖了一些极端的情况,而

这些极端情况显然是不能忽视的.因此,只用平均数还难以概括样本数据

的实际状态.

例如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数

如下:

甲:78795491074

乙:9578768677

如果你是教练,你应当如何对这次射击作出评价?

如果你是教练,你应当如何对这次射击作出评价?

①甲、乙两人本次射击的平均成绩分别为多少环?他们的平均成绩一样

吗?

提示:经计算得元甲=卷(7+8+7%当+4/+10+7⑷=7,

同理可得元?=7.他们的平均成绩一样.

孰道这两个人的水平就没有什么差异了吗?你能作出这两人成绩的频

率分布条形图来说明其水平差异在哪里吗?

提示频率分布条形图如下:

从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙

成绩相对集中.

(2)现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差

是不知道的.

如何求得总体的平均数和标准差呢?

提示:通常的做法是用样本的平均数和标准差去估计总体的平均数与标

通过实例分析,让学生掌

准差.这与前面用样本的频率分布来近似地代替总体分布是类似的.只要

握反映样本数字离散程

样本的代表性好,这样做就是合理的,也是可以接受的.

度的估计量;极差、方差

(3)考虑一个容量为2的样本:为3,其样本的标准差为公产,如果记

与标准差的计算方法,并

那么在数轴上和a有什么几何意义?由此说明标准差的大小对熟悉的应用,提升推理论

数据的离散程度有何影响?证能力,提高学生的数学

提示元和a的几何意义如图所示.显然,标准差越大,则a越大,数据的离散抽象、数学建模及逻辑推

程度越大,数据较分散;标准差越小,则a越小,数据的离散程度越小,数据理的核心素养。

较集中在平均数元的周围.

a

Xif_处+必x2x

2

2.填空

(1)假设一组数据是凶,松…,x”,用土表示这组数据的平均数,我们用每个

数据与平均数的差的绝对值作为“距离”,即/心与/(/=1,2,…,加作为X、

到元的“距离”.可以得到这组数据x“法,…,心到土的“平均距离”为

1ExHl.为了避免式中含有绝对值,通常改用平方来代替,即

ni=i

1£(X,3)2,我们称为这组数据的方差.有时为了计算方差的方便,我们还

ni=i

1no

把方差写成工E犹一元2

ni=i1

由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二

2

者单位一致,我们对方差开平方,取它的算术平方根,即1-£(xrx),我

Nni=i

们称为这组数据的标准差.

(2)如果总体中所有个体的变量值分别为匕场,…,K,总体平均数为则

N

称E(匕孑)2为总体方差,佞为总体标准差.与总体均值类似,总

体方差也可以写成加权的形式.如果总体的N个变量值中,不同的值共有

女UW心个,不妨记为K,五…,匕,其中匕出现的频数为£(?=1,2,…,4),

则总体方差为££(匕彳)2.

Ni=l

(3)如果一个样本中个体的变量值分别为几助…,场样本平均数为其则

n

称52jE(匕5)2为样本方差,sRF为样本标准差.

ni=i

对标准差和方差的理解

(I)样本标准差反映了各样本数据聚集于样本平均数周围的程度,标准差

越小,表明各个样本数据在样本平均数周围越集中;反之,标准差越大,表

明各样本数据在样本平均数的周围越分散.

(2)若样本数据都相等,则s=Q.

(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估

计总体的数字特征,而样本数据的离散程度,就由标准差来衡量.

(4)数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一

组数据变化的最大幅度,它对一组数据中的极端值非常敏感;方差则反映

了一组数据围绕平均数波动的大小.为了得到以样本数据的单位表示的

波动幅度,通常用标准差一一样本方差的算术平方根来描述.

(5)标准差的大小不会越过极差.

(6)方差、标准差、极差的取值范围为[0,+8).当标准差、方差为0时,

样本各数据全相等,表明数据没有波动幅度,数据没有离散性.

(7)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,

所以虽然方差和标准差在刻画样本数据的分散程度上是一样的,但在解

决实际问题时,一般采用标准差.

(8)在实际问题中,总体平均数和总体标准差都是未知的.就像用样本平

均数估计总体平均数一样,通常我们也用样本标准差去估计总体标准差.

在随机抽样中,样本标准差依赖于样本的选取,具有随机性.

做一做

1.判断下列说法是否正确,正确的在后面的括号内打“J”,错误的打

“X”.

①标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据

的离散程度越小.()

屐两组数据的方差一样大,则说明这两组数据都是相同的.()

答案:①,②X

2.对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的

最大速度(单位:m/s)如下:

甲:27,38,30,37,35,31

乙:33,29,38,34,28,36

根据以上数据,试判断他们谁更优秀.

解:元甲=*X(27+38+30+37+35+31)=33,

S2=

3甲

工X[(27-33)2+(38-33)2+(30-33)2+(37-33)2+(35-33)2+(31-33)2]上X93

66

15.7,

x=-X(33+29+38+34+28+36)-33,

乙76

S2=

工X[(33-33),(29-33)2+(38-33)2+(34-33)2*28-33)2+(36-33)2]2X76-

66

12.7.

所以X甲=x乙,s甲>s乙.

这说明甲、乙两运动员的最大速度的平均值相同,但乙比甲更稳定,故乙

比甲更优秀.

有关平均数、方差的重要结论

1.思考

若x,x,…,x的方差是s,则ax,ax,1••,ax的方差是多少?

12n12n

22

提示:由方差的定义知ax,ax,…,ax的方差是as.

12n

2.填空

⑴若x,x,…,x的平均数是,则nix+a,mx+a,•••,mx+a的平均数是

12n12n

uix+a

(2)数据x,x,…,x与数据x+a,x+a,…x+a的方差相等.

12n12n

222

⑶若x,x,…,x的方差为s,则ax,ax,…、ax的方差为as.

12n12n

⑷方差的简化公式:s'WKx/+七2-府2],或写成S24(好+

诏i♦依附即方差等于原数据平方的平均数减去平均数的平方.

2

2.己知样本数据x,x的平均数元=5,s2,则样本数据

12n

2%+1,2x+\,2x+X的平均数为_________,方差为___________.

12n

答案:118

解析:因为样本数据x,x,x的平均数土=5,所以样本数据

12n

2x+l,2x+l,…,2x+l的平均数为25+1-2X5+1=11.方差为

!2n

22

2Xs-4X2-8.

例1在对树人中学高一年级学生身高的调查中,采用样本量比例分配

的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平

均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分

别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年

级全体学生的身高方差作出估计吗?

-J

解:把男生样本记为X,X,…,X,其平均数记为尤,方差记为力;

1223

把女生样本记为y,y,...y,其平均数记为,方差记为sy;把

1227

总样本数据的平均数记为,方差记为.一

2

25

根据方差的定义,总样本方差为

12327

S”=6电(七一彳)2+石(为一刃2]

/=I;=1

23.+27歹

z=---------------=1OJ.2

23+27

12327

S2电(为-刃2+£(力-彳A]

i=ij=]

i2327

?•=]7=i

2323

•••Z(七一亍+于一z)2=Zl(x,_元)2+2(西一x)(x-z)+(x-z)2]

i=li=l

2323

由Z(毛-君=Zxi~23元=0,可得

i=li=l

2323

E2(七一-z)=2(亍-z)S(X,一方=°

i=li=l

27

同理可得£2(刀-歹竹-刃=0

j=l

12327

52一切2+之(y广刃2]

3Ui=iJ=I

i2327

=[;[2(玉_亍+亍_彳)2+$(匕一y+'一刃2]

i=ij=\

12327

因此『=右{皂K%_元>+(元一刃2]+皂[(匕一歹)2+(》一刃2]

3Ui=1j=i

1「23232727

4£;(“元)2+1(元—寸+。(刀一»+一(》一为2

3Ui=iz=ij=i;=i

男生23人,其平均数和方差分别为170.6和12.59,

女生27人,其平均数和方差分别为160.6和38.62

z=165.2

把已知的男生、女生样本平均数和方差的取值代入,可得

?=51.4862=*{23厌+(x-z)2]+27[s;+(y-z)2]}

分层随机抽样的方差

设样本容量为n,平均数为三,其中两层的个体数量分别为m,ri?,两层

的平均数分别为I1,T2,方差分别为S*st则这个样本的方差为

S2=—[s?+(X|—X)2]+坦[s;+(X2—X)"]

nn

跟踪训练1.在一个文艺比赛中,8名专业人士和12名观众代表各组成

一个评判小组,给参赛选手打分.在给某选手的打分中,专业人士打分

的平均数和标准差分别为47.4和3.7,观众代表打分的平均数和标准差

为56.2和11.8,试根据这些数据计算这名选手得分的平均数和方差.

解桅杷专业人士打分样本记为小斯顺好均崎,方差id为小出现储愫打分样

本记为物力…,加其平均数为?,方差记为“出总保席的平均费记为5,方差记为上

_O

则总样本平均数为:Z=彳X47.4+而X56.2=52.68(分),

/UNU

18-12-

总样本方差为:,=而[2(X,—z)2]+Z;(V,—z)2]

XV.<.”

1-1J=1

=点{8[屋+(*—z)2]+12[s}+(y—z)2]}

=^{8[3.72+(47.4-52.68)2]+12[11.82+(56.2-52.68)2]}=107.6

所以这名选手得分的平均数为52.68分,方差为107.6

计算分层随机抽样的方差#的步骤

(1)确定X1,X2,北,金,

(2)确定:;

(3)应用公式s=—[^+(xi—AT)2]+—[si+(x2—AT)2].计算s.

nn

假设通过简单随机抽样,获得了100户居民的月均用水量数据(单位:0

9.013.614.95.94.07.16.45.4

19.42.02.28.613.85.410.24.9

6.814.02.010.52.15.75.116.8

6.011.11.311.27.74.92.310.0

16.712.012.47.85.213.62.422.4

3.67.18.825.63.218.35.12.0

3.012.022.210.85.52.024.39.9

3.65.64.47.95.124.56.47.5

4.720.55.515.72.65.75.56.0

16.02.49.53.717.03.84.12.3

5.37.88.14.313.36.81.37.0

4.91.87.128.0:10.213.817.910.15.5

4.63.221.6

计算出样本平均数X=8.79,样本标准差$七6.20

J-5=2.59,

x+5=14.99,

x—2s=—3.61,

X4-25=21.19.

如图所示,可以发现,这100个数据中大部分落在区间1无-S,元+S]内,

在区间[x-2s,x+2s]外的只有7个.也就是说,绝大部分数据

落在[x-2s,x+2s]内.「一2s,5+2s]

样本标准差刻画了数据离平均数波动的浮动大小,平均数和标准差一起

能反映数据取值的信息.

三、达标检测

1.为评估一种农作物的种植效果,选了〃块地作试验田.这〃块地的亩产通过练习巩固本节所学

量(单位:kg)分别是X,X,X,下面给出的指标中可以用来评估这种农知识,通过学生解决问

12n

题,发展学生的数学抽

作物亩产量稳定程度的是()

象、逻辑推理、数学运算、

A.x,x,x的平均值

12n

数学建模的核心素养。

B.X,X,…,X的标准差

12n

C.x,x,…,x的最大值

12n

D.x,x,…,x的中位数

12n

答案:B

解析:在A中,平均数是表示一组数据集中趋势的量,它是反映数据集中趋

势的一项指标,故A不可以用来评估这种农作物亩产量的稳定程度;在B

中,标准差能反映一组数据的离散程度,故B可以用来评估这种农作物亩

产量的稳定程度;在C中,最大值是一组数据中最大的量,故C不可以用来

评估这种农作物亩产量的稳定程度;在D中,中位数将数据分成前半部分

和后半部分,用来代表一组数据的''中等水平”,故D不可以用来评估这

种农作物亩产量的稳定程度,故选B.

2.样本中共有五个个体,其值分别为a,0,1,2,3.若该样本的平均值为1,

则样本的方差为()

A.pB.7C.V2D.2

y55

解析:由平均值为1可得”生产=1,

解得a=-l,所以样本方差「*2-】产+(8〉,故选D.

答案:D

3.(多选)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计

图如图所示,则以下选项判断不正确的有()

A.甲的成绩的平均数小于乙的成绩的平均数

B.甲的成绩的中位数等于乙的成绩的中位数

C.甲的成绩的方差小于乙的成绩的方差

D.甲的成绩的极差小于乙的成绩的极差

[频数J频数

33|-|

2-2

1人,nnnnn...1一

0345678910环数。345678910环;

甲乙

解析:由题意可知,甲的成绩为4,5,6,7,8,乙的成绩为5,5,5,6,9.所以

甲、乙的成绩的平均数均为6,A错;甲、乙的成绩的中位数分别为6,5,B

错;甲、乙的成绩的方差分别为

1x[(4-6)2+(5-6)2+(6-6)2+(7-6)2+(8-6)2]|X[(5-6)2+(5-6)2+(5-6)2+

(6-6)2X9-6)2]专,C对;甲、乙的成绩的极差均为4,D错.

答案:ABD

4.甲、乙、丙、丁四人参加某运动会射击项目选拔赛,四人的平均成绩和

方差如下表所示:

若要从这四人中选择一人去参加该运动会射击项目比赛,最佳人选

是.(填“甲”“乙”“丙”“丁”中的一个)

甲乙丙丁

平均环数又8.38.88.88.7

方差¥3.53.62.25.4

答案:丙

解析:分析表格数据可知,乙与丙的平均环数最多,又丙的方差比乙小,说

明丙成绩发挥得较为稳定,所以最佳人选为丙.

5.计算数据54,55,53,56,57,58的方差.

分析可以根据简化公式进行计算,也可以把每个数据减去一个数,用找齐

法计算.

解:(解法一)元2=542+552+53斗562+572+58£3Q83.17,X-55.5,故5=3

083.17-55.524.92.

(解法二)每个数据减去55得到新的数据组-1,0,-2,1,2,3,该组数据的方

差与原数据组的方差相等,且元2=1+。+4:1+4+9月3.17)7=

O

-1+02+1+2+3^5,故S?=3.17-0.52=2.92.

6

6.在一次科技知识竞赛中,某学校的两组学生的成绩如下表:请根据你

所学过的统计知识,判断这两个组在这次竞赛中的成绩谁优谁劣,并说

明理由.

解⑴甲组成绩的众数为90,乙组成绩的众数为70,从成绩的众数比较

看,甲组成绩好些.

一1

(2)x单=u—(50X2+60X5+70X10+80X13+

2十b十1。十13十14十b

90X14+100X6)=白义4000=80,

—1

X乙=/_I_3-IC_LS(50X4+60X4+70X16+80X2+90X12+

4+4+16+2+12+12

100X12)=777X4000=80.

bU

x(50-80)2+5X(60-80)2+10X(70-

2十5十1。十13十14十b

80)2+13X(80-80)2+14X(90-80)2+6X(100-80)2]=172,

或二(50-80)2+4X(60-80)2+16X(70-

4十4十]。十Z十1,Z十1/

80)2+2X(80-80)2+12X(90-80)2+12X(100-80)2]=256.

•••7单=7乙,s微s".•.甲组成绩较乙组成绩稳定,故甲组好些.

(3)甲、乙两组成绩的中位数、平均数都是80分.其中,甲组成绩在80

分以上(包括80分)的有33人,乙组成绩在80分以上(包括80分)的有

26人.从这一角度看,甲组的成绩较好.

(4)从成绩统计表看,甲组成绩大于等于90分的有20人,乙组成绩大于

等于90分的有24人,所以乙组成绩集中在高分段的人数多.同时,乙

组得满分的人数比甲组得满分的人数多6人.从这一角度看,乙组的成

绩较好.

四、小结

1.极差的定义及特征:通过总结,让学生进一步

2.方差、标准差的定义及特征巩固本节所学内容,提高

总体方差、总体标准差的定义概括能力。

样本方差、样本标准差的定义

3.会求方差、标准差,并做出决策

4.方差的运算性质:

5.会求分层抽样的方差

五、课时练

【教学反思】

本节课通过对反映样本数据离散程度的估计量;极差、方差与标准差的回顾,进一步研

究和学习用样本的数字特征估计总体的数字特征以及初步应用,有利于进一步完善对统计

学认识的系统性,加深对统计学思想方法的理解。教学中要注重学生的主体地位,调动学生

积极性,使数学教学成为数学活动的教学。从而发展学生的直观想象、逻辑推理、数学建模

的核心素养。

《9.2.4总体离散程度的估计》导学案

【学习目标】

1.会用样本的极差、方差与标准差估计总体,。

2.通过用样本的数字特征估计总体的数字特征的研究,渗透统计学的思想和方法。

3.培养学生收集数据、分析数,据、归纳和整理数据,增强学习的积极性。

【学习重点】:方差、标准差的计算方法。

【学习难点】:如何利用样本的方差、标准差对总体数据作出分析及判断数据的稳定性。

【知识梳理】

一、温故知新

(1)众数

欧义:一组数据中出现次数最多的数据(即频率分布最大值所对应的样本数据)称为这

组数据的众数.

②恃征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势.

(2)中位数

⑦定义:一组数据按从小到大(或从大到小)的顺序排成一列,处于最中间的一个数据(当

数据个数是奇数时)或最中间两个数据的平均数(当数据个数是偶数时)称为这组数据的中位

数.

②特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图

中,中位数左边和右边的直方图的面积相等.

(3)平均数

①定义:一组数据的和与这组数据的个数的商.数据x,x,…,x的平均数为后.=

12n

41+%2+…+%n

n

②恃征:平均数对数据有“取齐”的作用,代表该组数据的平均水平,任何一个数据的改

变都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,

平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,

使平均数在估计总体时的可靠性降低.

1、众数在样本数据的频率分布直方图中,就是最高矩形的中点的横坐标。

2、利用频率分布直方图(频率分布表),求样本的平均数、中位数和众数的近似估计,

进而估计总体的平均数、中位数和众数.

2、在样本中,有50%的个体小于或等于中位数,也有50%的个体大于或等于中位数,

因此,在频率分布直方图中,中位数左边和右边的直方图的面积应该相等,由此可

估计中位数的值。

3、平均数是频率分布直方图的“重心”.是直方图的平衡点.频率直方图中每个小长

方形的面积乘以小矩形底边中点的横坐标之和。

三种数字特征的优缺点

名称优点缺点

①它只能表达样本数据中很少的

⑦体现了样本数据的最大集中点;②容易

众数一部分信息;②无法客观地反映总

得到

体特征

①不受少数几个极端数据,即排序靠前或

中位数靠后的几个数据的影响;②容易得到,便于对极端值不敏感

利用中间数据的信息

任何一个数据的改变都会引起平

平均数能反映出更多关于样本数据全体的信息均数的改变,数据越“离群”,对

平均数的影响越大

【学习过程】

一、情境与问题

样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容

易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数

据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本

数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生

较大的误差,难以反映样本数据的实际状况,很多时候还不能使我们做出有效决策.因此,

我们需要一个统计数字刻画样本数据的离散程度.

方差、标准差

1.思考

(1)平均数向我们提供了样本数据的重要信息,但是,平均数有时也会使我们作出对总体

的片面判断,因为这个平均数掩盖了一些极端的情况,而这些极端情况显然是不能忽视的.因

此,只用平均数还难以概括样本数据的实际状态.

例如:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:

甲:78795491074

乙:9578768677

如果你是教练,你应当如何对这次射击作出评价?

如果你是教练,你应当如何对这次射击作出评价?

①甲、乙两人本次射击的平均成绩分别为多少环?他们的平均成绩一样吗?

提示:经计算得元印=2(7用+7月巧尚理+10+7弘)A

T10

同理可得元乙守.他们的平均成绩一样.

至滩道这两个人的水平就没有什么差异了吗?你能作出这两人成绩的频率分布条形图来

说明其水平差异在哪里吗?

提示频率分布条形图如下:

从图上可以直观地看出,他们的水平还是有差异的,甲成绩比较分散,乙成绩相对集中.

(2)现实中的总体所包含的个体数往往是很多的,总体的平均数与标准差是不知道的.

如何求得总体的平均数和标准差呢?

提示:通常的做法是用样本的平均数和标准差去估计总体的平均数与标准差.这与前面

用样本的频率分布来近似地代替总体分布是类似的.只要样本的代表性好,这样做就是合理

的,也是可以接受的.

(3)考虑一个容量为2的样本:为〈先,其样本的标准差为竽,如果记a言那么在数轴

上万和a有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?

提示元和a的几何意义如图所示.显然,标准差越大,则a越大,数据的离散程度越大,数

据较分散;标准差越小,则a越小,数据的离散程度越小,数据较集中在平均数元的周围.

a

XiXj+X2X2X

2

2.填空

(1)假设一组数据是小,检…,x„用元表示这组数据的平均数.我们用每个数据与平均数

的差的绝对值作为“距离”,即/必子/(/=1,2,…作为必到元的“距离”.可以得到这组数

n

据小,也,…,为到元的“平均距离”为工1E/修三/.为了避免式中含有绝对值,通常改用平方来

nj=i

代替,g|J-£(先与);我们称为这组数据的方差.有时为了计算方差的方便,我们还把方差写

ni=i

n

成一1ixf-Xn.

ni=i1

由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我

2

们对方差开平方,取它的算术平方根,Upj-£(xrx),我们称为这组数据的标隹差.

(2)如果总体中所有个体的变量值分别为K,%…,K,总体平均数为G,则称

N

£(K-n2为总体方差,s八序为总体标准差.与总体均值类似,总体方差也可以写成加

权的形式.如果总体的川个变量值中,不同的值共有AJW.AJ个,不妨记为九%…,匕,其中K

出现的频数为£31,2,…,4),则总体方差为6乏EEH-".

Ni=l

(3)如果一个样本中个体的变量值分别为几用…,%样本平均数为歹,则称

a£(%3),为样本方差,s7乒为样本标准差.

ni=l

对标准差和方差的理解

(1)样本标准差反映了各样本数据聚集于样本平均数周围的程度,标准差越小,表明各个

样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的周围

越分散.

(2)若样本数据都相等,则s=0.

(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数字

特征,而样本数据的离散程度,就由标准差来衡量.

(4)数据的离散程度可以通过极差、方差或标准差来描述.极差反映了一组数据变化的最

大幅度,它对一组数据中的极端值非常敏感;方差则反映了一组数据围绕平均数波动的大小.

为了得到以样本数据的单位表示的波动幅度,通常用标准差一一样本方差的算术平方根来描

述.

(5)标准差的大小不会越过极差.

(6)方差、标准差、极差的取值范围为[0,+8).当标准差、方差为。时,样本各数据全相

等,表明数据没有波动幅度,数据没有离散性.

(7)因为方差与原始数据的单位不同,且平方后可能夸大了偏差的程度,所以虽然方差和

标准差在刻画样本数据的分散程度上是一样的,但在解决实际问题时,一般采用标准差.

(8)在实际问题中,总体平均数和总体标准差都是未知的,就像用样本平均数估计总体平

均数一样,通常我们也用样本标准差去估计总体标准差.在随机抽样中,样本标准差依赖于样

本的选取,具有随机性.

做一做

1.判断下列说法是否正确,正确的在后面的括号内打“J”,错误的打“X”.

&标准差、方差越大,数据的离散程度越大;标准差、方差越小,数据

的离散程度越小.()

②若两组数据的方差一样大,则说明这两组数据都是相同的.()

2.对划艇运动员甲、乙在相同的条件下进行了6次测试,测得他们每次的最大速度(单

位:m/s)如下:

甲:27,38,30,37,35,31

乙:33,29,38,34,28,36

根据以上数据,试判断他们谁更优秀.

有关平均数、方差的重要结论

1.思考

2

若x,x,…,x的方差是sy则ax,ax,ax的方差是多少?

12〃12n

22

提示:由方差的定义知ax,ax,…,ax的方差是as.

12n

2.填空

⑴若x,x,…,x的平均数是,则mx+a,mx・・・,mx+a的平均数是应+a

I2n12n

(2)数据x,x,…,x与数据xx七,・,・x+a的方差相等.

12n12n

222

(3)若x,x,…,x的方差为s,则ax,ax,ax的方差为as.

12ni2n

⑷方差的简化公式:丁+(%12+―224・・恤2)一反2],或写成$2,⑸十一“..煽)-%2,

即方差等于原数据平方的平均数减去平均数的平方.

跟踪训练2.已知样本数据x,x,…,x的平均数元=5,s2,则样本数据

12n

2x+\,2x+1,…,2x+1的平均数为,方差为.

12n

例1在对树人中学高一年级学生身高的调查中,采用样本量比例分配的分层随机抽

样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,

抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的

方差,并对高一年级全体学生的身高方差作出估计吗?

分层随机抽样的方差

设样本容量为n,平均数为其中两层的个体数量分别为m,%两层的平均数分别

为与I,方差分别为si,si,则这个样本的方差为

S2=—[s?+(X1—X)■']+-[S2+(X2—x)2]

nn

1.在一个文艺比赛中,8名专业人士和12名观众代表各组成一个评判小组,给参赛选

手打分.在给某选手的打分中,专业人士打分的平均数和标准差分别为47.4和3.7,观众

代表打分的平均数和标准差为56.2和11.8,试根据这些数据计算这名选手得分的平均数和

方差.

靳把专业人士打分样本记为小物…,即其平均施为工方就为亲出观众代表打分样

本记加,加…,J12)斛懒为j,方差记为由撼体辘的聘翅痴,方就W.

_Q

则总样本平均数为:%=^X47.4+6X56.2=52.68(分),

Xv/U

18—12—

总样本方差为:,=对2(Xj—Z)2]+S(Vy—Z)2]

却i-ly-1

=点{8层+(x-Z)21+12[^+(J-z)2]}

=^{8[3.72+(47.4-52.68)2]+12[11.82+(56.2-52.68)2]}=107.6

所以这名选手得分的平均数为52.68分,方差为107.6

计算分层随机抽样的方差9的步骤

(1)确定X”X2,S1,送,

(2)确定x;

(3)应用公式S2=—[51+(X1—X)2]+—[&+(X2—X)2].计算S2.

nn

假设通过简单随机抽样,获得了100户居民的月均用水量数据(单位:力

9.013.614.95.94.07.16.45.419.42.0

2.28.613.85.410.24.96.814.02.010.5

2.15.75.116.86.011.11.311.27.74.9

2.310.016.712.012.47.85.213.62.422.4

3.67.18.825.63.218.35.12.03.012.0

22.210.85.52.024.39.93.65.64.47.9

5.124.56.47.54.720.55.515.72.65.7

5.56.016.02.49.53.717.03.84.12.3

5.37.88.14.313.36.81.37.04.91.8

7.128.010.213.817.910.1I5.54.63.221.6

计算出样本平均数x=8.79,样本标准差5-6.20

1-5=2.59,

x+5=14.99,

x—2s——3.61,

X+2A=21.19.

如图所示,可以发现,这100个数据中大部分落在区间1无-S,元+s]内,在区间

外的只有族个2也就原说,绝大部分数据落在内.1x-2s,x+2s]

样本标准差刻画了数据离平均数波动的浮动大小,平均数和标准差一起能反映数据取

值的信息.

【达标检测】

1.为评估一种农作物的种植效果,选了〃块地作试验田.这〃块地的亩产量(单位:kg)分

别是X,X,…,X,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()

A.x、x,…,x的平均值B.x,x,…,x的标准差

12nI2n

C.X,X,…,X的最大值

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论