




已阅读5页,还剩16页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1,用样本的数字特征估计总体的数字特征,标准差,2,样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际情况产生较大的误差,难以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度.,3,实际问题:有两位射击运动员在一次射击测试中各射靶10次,每次命中的环数如下:,甲:,乙:,如果你是教练,你应当如何对这次射击作出评价?如果是一次选拔考核,你应该如何做选择?,计算可得,两人射击的平均成绩是一样的.那么两个人的水平就没有什么差异吗?,4,4,5,6,7,8,9,10,环数,频率,0.1,0.2,0.3,(甲),4,5,6,7,8,9,10,0.1,0.2,0.3,0.4,环数,频率,(乙),甲成绩比较分散,乙成绩相对集中,看来,平均数还难以概括样本的实际状态,因此,我们还需要从另外的角度来考察这两组数据.,5,思考:什么样的指标可以反映一组数据变化范围的大小?,我们可以用一组数据中的最大值减去最小值所得的差来反映这组数据的变化范围。用这种方法得到的差称为极差,极差最大值最小值,6,在生活中,我们常常会和极差打交道班级里个子最高的学生比个子最矮的学生高多少?家庭中年纪最大的长辈比年纪最小的孩子大多少?这些都是求极差的例子,例1.(口答)求下列各题的极差。(1)某班个子最高的学生身高为1.70米,个子最矮的学生的身高为1.38米,求该班所有学生身高的极差。(2)小明家中,年纪最大的长辈的年龄是78岁,年纪最小的孩子的年龄是9岁,求小明家中所有成员年龄的极差。,7,甲的环数极差=10-4=6乙的环数极差=9-5=4.,极差对极端值非常敏感,在一定程度上表明样本数据的的波动情况但极差只能反映一组数据中两个极端值之间的差异情况,对其他数据的波动情况不敏感,到底是A组还是B组数据更加稳定呢?有必要重新找一个对整组数据波动情况更敏感的指标,本节课我们就要来学习反应一组数据稳定程度的两个量方差、标准差,8,考察样本数据的分散程度的大小,最常用的统计量是标准差标准差是样本平均数的一种平均距离,一般用s表示,所谓“平均距离”,其含义可作如下理解:,9,于是样本数据x1,x2,xn,到x的平均距离是,平均距离标准差,由于上式含有绝对值,运算不太方便,因此,通常改用如下公式来计算标准差,10,考虑一个容量为2的样本:,标准差的几何意义,显然,标准差越大,则a越大,数据的离散程度越大;标准差越小,数据的离散程度越小.,标准差用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).,11,标准差的取值范围是什么?标准差为0的样本数据有什么特点?标准差是怎样表现数据的离散程度的?,标准差的取值范围:,0,+),标准差为0的样本数据都等于样本平均数.,标准差表现为:标准差越大,表明数据的离散程度就越大;反之,标准差越小,表明各数据的离散程度就越小。,它用来描述样本数据的离散程度。在实际应用中,标准差常被理解为稳定性。,标准差的作用:,12,例题分析,例1画出下列四组样本数据的条形图,说明他们的异同点.(1)5,5,5,5,5,5,5,5,5;(2)4,4,4,5,5,5,6,6,6;,13,(3)3,3,4,4,5,6,6,7,7;(4)2,2,2,2,5,8,8,8,8.,14,对于城市居民月均用水量样本数据,其平均数=1.973,标准差s=0.868.在这100个数据中,落在区间(-s,+s)=1.105,2.841外的有28个;落在区间(-2s,+2s)=0.237,3.709外的只有4个;落在区间(-3s,+3s)=-0.631,4.577外的有0个.,一般地,对于一个正态总体(,),数据落在区间()、()、()内的百分比分别为68.3%、95.4%、99.7%,这个原理在产品质量控制中有着广泛的应用(参考教材P79“阅读与思考”).,标准差还可用于对样本数据的另外一种解释,15,从数学的角度考虑,人们有时用标准差的平方s2_-方差来代替标准作为测量样本数据分散程度的工具。,步骤:求平均数;作差;平方;再求平均数,16,如果数据的平均数为,方差为,那么,17,18,练习:从甲乙两种玉米苗中各抽株,分别测得它们的株高如下(单位:cm),问:(1)哪一种玉米长得高?,(2)哪种玉米的苗长得齐?,19,小结,1.用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.,2.平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决问题作出决策.,3.对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性.,20,4.在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性.用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案.,21,练习:,(1)如果数据的平均数为,方差为,中位数为a,求数据3x1+5,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 拉巴尔护理流程图讲解
- 上海体育大学《医学信息织》2023-2024学年第一学期期末试卷
- 山东省日照市岚山区2025年中考数学试题模拟卷(一)含解析
- 上海市闵行区民办上宝中学2024-2025学年初三中考总复习单元同步滚动测试卷数学试题含解析
- 新疆天山职业技术大学《双语食品机械与设备》2023-2024学年第一学期期末试卷
- 新疆维吾尔自治区阿克苏地区沙雅县2025届初三下学期第一周综合自测化学试题含解析
- 长沙医学院《数据库》2023-2024学年第二学期期末试卷
- 江西农业大学《中学生物学教材分析与教学设计》2023-2024学年第二学期期末试卷
- 新疆乌鲁木齐市达标名校2025届初三全真模拟化学试题含解析
- 上海体育大学《无机及分析化学B》2023-2024学年第二学期期末试卷
- 两会安全施工方案
- 企业法律合规与风险防范的案例分析
- 阿尔及利亚医疗器械法规要求综述
- 《销售配合带动》课件
- 2023年10月自考试题00341公文写作与处理
- 刘姓氏的由来研究报告
- 《餐具我来摆》 课件
- 2023年小学世界知识产权日主题班会课件
- AOI检查缺陷识别对照表
- 数据标注行业的经济效益分析
- 《白雪公主》剧本台词中英文版
评论
0/150
提交评论