版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
9.2.4总体离散程度的估计平均数、中位数和众数为我们提供了一组数据的集中趋势的信息,这是概括一组数据的特征的有效方法.但仅知道集中趋势的信息,很多时候还不能使我们做出有效的决策.下面的问题就是一个例子.问题3有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:
甲:78795491074
乙:9578768677如果你是教练,你如何对这两位运动员的射击情况作出评价?如果这是一次选拔性考核,你应当如何作出选择?通过简单的排序和计算,可以发现甲、乙两名运动员射击成绩的平均数、中位数众数都是7.从这个角度看,两名运动员之间没有差别.作出两人成绩的频率分布条形图,观察他们水平差异!甲:78795491074
乙:9578768677作出两人射击成绩的频率分布条形图:环数频率0.40.30.20.145678910O(甲)环数频率0.40.30.20.145678910O(乙)
但从上图中看,甲的成绩比较分散,乙的成绩相对集中,即甲的成绩波动幅度比较大,而乙的成绩比较稳定.可见他们的射击成绩是存在差异的,那么,如何度量成绩的这种差异呢?甲:78795491074乙:9578768677一种简单的度量数据离散程度的方法就是用极差.根据甲、乙运动员的10次射击成绩,可以得到甲命中环数的极差=10-4=6乙命中环数的极差=9-5=4可以发现甲的成绩波动范围比乙大.极差在一定程度上刻画了数据的离散程度,但因为极差只使用了数据中最大、最小两个值的信息,对其他数据的取值情况没有涉及,所以极差所含的信息量很少。极差越大,数据越分散,越不稳定;极差越小,数据越集中,越稳定.我们知道,如果射击的成绩很稳定,那么大多数的射击成绩离平均成绩不会太远;相反,如果射击的成绩波动幅度很大,那么大多数的射击成绩离平均成绩会比较远.因此,我们可以通过这两组射击成绩与它们的平均成绩的“平均距离”来度量成绩的波动幅度.思考:如何定义“平均距离”?我们用每个数据与平均数的差的绝对值作为“距离”,即
由于上式含有绝对值,运算不太方便,通常改用平方来代替,即我们称(1)式为这组数据的方差.有时为了计算方便,我们还把方差写成以下形式由于方差的单位是原始数据的单位的平方,与原始数据不一致.为了使二者单位一致,我们对方差开方,取它的算数平方根,即我们称(2)式为这组数据的标准差如果总体中所有个体的变量值分别为Y1,Y2,…,YN
,总体平均数为Y,则称为总体的方差.与总体均值类似,总体的方差也还可以写成加权的形式.如果总体的N个变量值中,不同的值共有k个(k≤N),不妨记为:Y1,Y2,…,Yk,其中Yi出现的频数fi(i=1,2,…,k),则总体方差为如果一个样本中的变量值分别为:y1,y2,…,yn,样本平均数为y,则称为样本方差.标准差刻画了数据的离散程度或波动幅度,标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小;显然,在刻画数据的分散程度上,方差和标准差是一样的.但在解决实际问题中,一般多采用标准差.在实际问题中,总体平均数和总体标准差都是未知的.就像用样本平均数估计总体平平均数一样,通常我们也用样本标准差去估计总体标准差.在随机抽样中,样本标准差依赖于样本的选取,具有随机性.在问题3中,我们可以根据标准差来判断两名运动员的成绩的离散程度,计算可得由s甲>
s乙
可知,甲的成绩离散程度大,乙的成绩离散程度小.由此可以估计,乙比甲的射击成绩稳定.如果要从这两名选手中选择一名参加比赛,要看一下他们的平均成绩在所有参赛选手中的位置。如果两人都排在前面,就选成绩稳定的乙选手,否则可以选甲。
例6在对树人中学高一学生身高的调查中,采用样本比例分配的分层随机抽样,如果不知道样本数据,只知道抽取了男生23人,其平均数和方差分别为170.6和12.59,抽取了女生27人,其平均数和方差分别为160.6和38.62.你能由这些数据计算出总样本的方差,并对高一年级全体学生的身高方差作出估计吗?解:把男生样本记为:x1,x2,…,x23,平均数记为x,方差记为sx2;把女生样本记为:y1,y2,…,y27,平均数记为y,方差记为sy2;把总样本数据的平均数记为z,方差记为s2
.则解:把男生样本记为:x1,x2,…,x23,x=170.6,sx2=12.59;女生样本为:y1,y2,…,y27,y=160.6,方差记为sy2=38.62;总样本数据的平均数记为z,方差记为s2
.则根据方差的定义,总样本方差为解:把男生样本记为:x1,x2,…,x23,x=170.6,sx2=12.59;女生样本为:y1,y2,…,y27,y=160.6,方差记为sy2=38.62;总样本数据的平均数记为z,方差记为s2
.则解:把男生样本记为:x1,x2,…,x23,x=170.6,sx2=12.59;女生样本为:y1,y2,…,y27,y=160.6,方差记为sy2=38.62;总样本数据的平均数记为z,方差记为s2
.则根据按比例分配分层随机抽样总样本平均数与各层样本平均数的关系,可得总样本平均数为∴总样本的方差为51.4682,估计高一年级全体学生的身高的方差为51.4862.
样本标准差刻画了数据离平均数波动的幅度大小,平均数和标准差一起能反映数据取值的信息.
例如,根据9.2.1节中100户居民用户的月均用水量数据,可以计算出样本平均数和样本标准差分别为
1、数据5,7,7,8,10,11的标准差是()
A、8B、4C、2D、1C2、如果一组数中每个数加上同一个非零常数,则这一组数的().
A、平均数不变,标准差不变
B、平均数改变,标准差改变
C、平均数不变,标准差改变
D、平均数改变,标准差不变D练习巩固B166AB1.用定义计算样本方差和样本标准差2分层抽样总样本方差的计算课堂小结(1)标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大;标准差、方差越小,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 广东科贸职业学院《物理化学实验上》2023-2024学年第一学期期末试卷
- 广东警官学院《西方哲学原著》2023-2024学年第一学期期末试卷
- 广东交通职业技术学院《材料科学与工程专业导论》2023-2024学年第一学期期末试卷
- 广东技术师范大学《劳动教育2》2023-2024学年第一学期期末试卷
- 广东海洋大学《建设工程项目管理》2023-2024学年第一学期期末试卷
- 防突培训课件
- 培训课件内容分析
- 小学生读名著分享课件
- 广东碧桂园职业学院《人工智能技术基础》2023-2024学年第一学期期末试卷
- 共青科技职业学院《机械CAD》2023-2024学年第一学期期末试卷
- 安全生产事故举报奖励制度
- 冠心病健康教育完整版课件
- 国家开放大学《理工英语1》单元自测8试题答案
- 重症患者的容量管理课件
- 期货基础知识TXT
- 六年级上册道德与法治课件-第一单元 我们的守护者 复习课件-人教部编版(共12张PPT)
- 《尖利的物体会伤人》安全教育课件
- 安全管理体系及保证措施
- 大学生自主创业证明模板
- 启闭机试运行记录-副本
- 少儿美术画画 童画暑假班 7岁-8岁 重彩 《北京烤鸭》
评论
0/150
提交评论