标准差的意义_第1页
标准差的意义_第2页
标准差的意义_第3页
标准差的意义_第4页
标准差的意义_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

标准差的意义第一页,共二十一页,2022年,8月28日

样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.第二页,共二十一页,2022年,8月28日实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:甲:78795491074乙:9578768677如果你是教练,你应当如何对这次射击作出评价?如果是一次选拔考核,你应该如何做选择?计算可得两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?第三页,共二十一页,2022年,8月28日45678910环数频率0.10.20.3(甲)456789100.10.20.30.4环数频率(乙)甲成绩比较分散,乙成绩相对集中看来,平均数还难以概括样本的实际状态,因此,我们还需要从另外的角度来考察这两组数据.第四页,共二十一页,2022年,8月28日思考:什么样的指标可以反映一组数据变化范围的大小?

我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围。用这种方法得到的差称为极差.

极差=最大值-最小值

第五页,共二十一页,2022年,8月28日

在生活中,我们常常会和极差打交道.班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子.例1.(口答)求下列各题的极差。(1)某班个子最高的学生身高为1.70米,个子最矮的学生的身高为1.38米,求该班所有学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是9岁,求小明家中所有成员年龄的极差。第六页,共二十一页,2022年,8月28日甲的环数极差=10-4=6乙的环数极差=9-5=4.极差对极端值非常敏感,在一定程度上表明样本数据的的波动情况.但极差只能反映一组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感,到底是A组还是B组数据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的指标本节课我们就要来学习反应一组数据稳定程度的两个量――方差、标准差.第七页,共二十一页,2022年,8月28日考察样本数据的分散程度的大小,最常用的统计量是标准差.标准差是样本平均数的一种平均距离,一般用s表示.所谓“平均距离”,其含义可作如下理解::x。xxxxxin的距离是到表示这组数据的平均数假设样本数据是--,,...,21第八页,共二十一页,2022年,8月28日

于是样本数据x1,x2,……xn,到x的平均距离是平均距离标准差由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差.第九页,共二十一页,2022年,8月28日考虑一个容量为2的样本:标准差的几何意义a显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.标准差用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).第十页,共二十一页,2022年,8月28日标准差的取值范围是什么?标准差为0的样本数据有什么特点?标准差是怎样表现数据的离散程度的?标准差的取值范围:[0,+∞)标准差为0的样本数据都等于样本平均数.标准差表现为:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小。它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。标准差的作用:第十一页,共二十一页,2022年,8月28日例题分析例1

画出下列四组样本数据的条形图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;O频率1.00.80.60.40.212345678

(1)O频率1.00.80.60.40.212345678

(2)第十二页,共二十一页,2022年,8月28日(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.频率1.00.80.60.40.212345678

O(3)1.00.80.60.40.2(4)频率12345678

O第十三页,共二十一页,2022年,8月28日对于城市居民月均用水量样本数据,其平均数=1.973,标准差s=0.868.在这100个数据中,落在区间(-s,+s)=[1.105,2.841]外的有28个;落在区间(-2s,+2s)=[0.237,3.709]外的只有4个;落在区间(-3s,+3s)=[-0.631,4.577]外的有0个.一般地,对于一个正态总体(,),数据落在区间()、()、()内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).标准差还可用于对样本数据的另外一种解释第十四页,共二十一页,2022年,8月28日

从数学的角度考虑,人们有时用标准差的平方s2_--------方差来代替标准作为测量样本数据分散程度的工具。步骤:求平均数;作差;平方;再求平均数第十五页,共二十一页,2022年,8月28日如果数据的平均数为,方差为,那么第十六页,共二十一页,2022年,8月28日第十七页,共二十一页,2022年,8月28日练习2:从甲乙两种玉米苗中各抽10株,分别测得它们的株高如下(单位:cm)问:(1)哪一种玉米长得高?(2)哪种玉米的苗长得齐?————第十八页,共二十一页,2022年,8月28日小结1.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.2.平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.3.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.第十九页,共二十一页,2022年,8月28日4.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.第二十页,共二十一页,2022年,8月28日练习:(1)如果数据的平均数为,方差为,中位数为a,求数据3x1+5,3

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论