




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1.1.正确理解样本数据标准差的意义和作用,学会计算数据正确理解样本数据标准差的意义和作用,学会计算数据的标准差的标准差. .2. 2. 理解用样本的基本数字特征来估计总体的基本数字特征理解用样本的基本数字特征来估计总体的基本数字特征. .(难点)(难点)3.3.会应用相关知识会应用相关知识来来解决简单的统计问题解决简单的统计问题. .( (重点)重点)2.2.2 用样本的数字特征估计 总体的数字特征1.1.对一个未知总体,我们常用样本的频率分布对一个未知总体,我们常用样本的频率分布来来估计总体的估计总体的分布,其中表示样本数据的频率分布的基本方法有哪些?分布,其中表示样本数据的频率分布的基本
2、方法有哪些?2.2.美国美国NBANBA在在2006200620072007年度赛季中,甲、乙两名篮球运动员年度赛季中,甲、乙两名篮球运动员在随机抽取的在随机抽取的1212场比赛中的得分情况如下:场比赛中的得分情况如下:乙:乙:8,13,14,16,23,26,28,38,39,51,31,29.甲:甲:12,15,20,25,31,31,36,36,37,39,44,49.问题问题1 哪一位运动员发挥稳定?哪一位运动员发挥稳定?图、表图、表 总体数据的数字特征总体数据的数字特征 用样本的数字特征来估计总体的数字特征用样本的数字特征来估计总体的数字特征1.1.众数众数: : 在一组数据中,出现
3、次数最多的数据叫做这一组数在一组数据中,出现次数最多的数据叫做这一组数据的众数据的众数. .2.2.中位数中位数: : 将一组数据按大小顺序依次排列(相同的数字将一组数据按大小顺序依次排列(相同的数字也要全部写出来),把处在也要全部写出来),把处在最中间位置的一个最中间位置的一个数据(或是数据(或是最中间两个数据的平均数最中间两个数据的平均数)叫做这组数据的中位数)叫做这组数据的中位数. .3.3.平均数平均数: :一组数据的和除以数据的个数所得到的数一组数据的和除以数据的个数所得到的数. . 思考思考1 1:怎样将各个样本数据汇总为一个数值,并使它怎样将各个样本数据汇总为一个数值,并使它成为
4、样本数据的成为样本数据的“中心点中心点”? ?众数、中位数、平均数众数、中位数、平均数月均用水量月均用水量/t频率频率/组距组距0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.50.5 1 1.5 2 2.5 3 3.5 4 4.5 O取最高矩形下端中点的横取最高矩形下端中点的横坐标坐标2.252.25作为众数作为众数. . 思考思考2 2:在城市居民月均用水量样本数据的频率分布直在城市居民月均用水量样本数据的频率分布直方图中,你认为众数应在哪个小矩形内?由此估计总体的众方图中,你认为众数应在哪个小矩形内?由此
5、估计总体的众数是什么?数是什么? (1)(1)每个小矩形的每个小矩形的面积面积即为所在组的即为所在组的频率频率,(2)(2)中位数左、右两边中位数左、右两边的直方图的的直方图的面积相等面积相等思考思考3 (1)在频率分布直方图中,每个小矩形的面积表示什么?在频率分布直方图中,每个小矩形的面积表示什么? (2)中位数左右两侧的直方图的面积应有什么关系?中位数左右两侧的直方图的面积应有什么关系?从左至右各个小矩形的面积分别是从左至右各个小矩形的面积分别是0.040.04,0.080.08,0.150.15,0.220.22, 0.25,0.14,0.06,0.04,0.02.0.25,0.14,0
6、.06,0.04,0.02.0.04+0.08+0.15+0.22=0.490.04+0.08+0.15+0.22=0.49,0.5-0.49=0.010.5-0.49=0.010.010.010.5=0.020.5=0.02,2+0.02=2.022+0.02=2.02,所以中位数是,所以中位数是2.02. 2.02. 月均用水量月均用水量/t0.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o频率频率/组距组距S=0.1月均用水量月均用水量/t0
7、.500.500.400.400.300.300.200.200.100.100.5 1 1.5 2 2.5 3 3.5 4 4.5 0.5 1 1.5 2 2.5 3 3.5 4 4.5 o o频率频率/组距组距各小矩形底边各小矩形底边中点的横坐标中点的横坐标为:为:0.25,0.75,1.25,1.75,2.25,2.75, 3.25,3.75,4.25. 各小矩形的各小矩形的面积面积(频率频率)为:为:0.04,0.08,0.15,0.22, 0.25,0.14, 0.06, 0.04,0.02.11221:niinnixs xs xs xs x4思平均数考isi第 个小矩形的面积;ix
8、 第i个小矩形底边中点的横坐标。 0.25 0.250.04+0.04+0.750.750.080.08+1.25+1.250.15+0.15+1.751.750.220.22+2.25+2.250.25+0.25+2.752.750.140.14+3.25+3.250.06+0.06+3.753.750.040.04+4.25+4.250.020.02=2.02=2.02(t t). . 所以平均数是所以平均数是2.02. 2.02. 平均数与中位数相等,是必然还是巧合?平均数与中位数相等,是必然还是巧合? 纯属巧合纯属巧合11221niinnixs xs xs xs x平均数中点横坐标中点
9、横坐标:0.25,0.75,1.25,1.75,2.25,2.75,3.25,3.75,4.25.面积面积(频率频率):0.04,0.08,0.15,0.22, 0.25,0.14,0.06, 0.04,0.02.x =频率分布直方图损失了一些样本数据,得到的是一个估计值,频率分布直方图损失了一些样本数据,得到的是一个估计值,且所得的估计值与数据分组有关且所得的估计值与数据分组有关. .注注: :在只有样本频率分布直方图的情况下,我们可以按上述方在只有样本频率分布直方图的情况下,我们可以按上述方法估计众数、中位数和平均数,并由此估计总体特征法估计众数、中位数和平均数,并由此估计总体特征. .思
10、考:从居民月均用水量样本数据可知,该样本的众数是思考:从居民月均用水量样本数据可知,该样本的众数是2.3,中位数是中位数是2.0,平均数是,平均数是1.973,这与我们从样本频率分布直方图,这与我们从样本频率分布直方图得出的结论有偏差,你能解释一下原因吗?得出的结论有偏差,你能解释一下原因吗?样本计算结果,样本计算结果, 众数:众数:2.3,中位数:,中位数:2.0,平均数:,平均数:1.973,频率直方图结果,众数:频率直方图结果,众数:2.25,中位数:,中位数:2.02,平均数:,平均数:2.02,思考思考(1)(1)一组数据的中位数一般不受少数几个极端值的影响,一组数据的中位数一般不受
11、少数几个极端值的影响,这在某些情况下是一个优点,但它对极端值的不敏感有时也会这在某些情况下是一个优点,但它对极端值的不敏感有时也会成为缺点,你能举例说明吗?成为缺点,你能举例说明吗?(2)(2)样本数据的平均数大于(或小于)中位数说明什么问题?样本数据的平均数大于(或小于)中位数说明什么问题?(3)(3)你怎样理解你怎样理解“我们单位的收入水平比别的单位高我们单位的收入水平比别的单位高”这句话的这句话的含义?含义? (1) (1)如:样本数据收集有个别差错不影响中位数;如:样本数据收集有个别差错不影响中位数; 大学毕业生凭工资中位数找单位可能收入较低大学毕业生凭工资中位数找单位可能收入较低.
12、. (2) (2)平均数大于(或小于)中位数,说明样本数据中存在平均数大于(或小于)中位数,说明样本数据中存在许多较大(或较小)的极端值许多较大(或较小)的极端值. . (3) (3)这句话具有模糊性甚至蒙骗性,其中收入水平是员工这句话具有模糊性甚至蒙骗性,其中收入水平是员工工资的某个中心点,它可以是众数、中位数或平均数工资的某个中心点,它可以是众数、中位数或平均数. .思考思考1 1:在一次射击选拔赛中,甲、乙两名运动员各射击:在一次射击选拔赛中,甲、乙两名运动员各射击1010次,每次命中的环数如下:次,每次命中的环数如下:甲:甲:7 8 7 9 5 4 9 10 7 47 8 7 9 5
13、4 9 10 7 4乙:乙:9 5 7 8 7 6 8 6 7 79 5 7 8 7 6 8 6 7 7甲、乙两人本次射击的平均成绩分别为多少环?甲、乙两人本次射击的平均成绩分别为多少环?77xx甲乙, .标准差标准差思考思考2 2:甲、乙两人射击的平均成绩相等,观察两人成绩的:甲、乙两人射击的平均成绩相等,观察两人成绩的频率分布直方图,你能说明其水平差异在哪里吗?频率分布直方图,你能说明其水平差异在哪里吗?甲的成绩比较分散,极差较大甲的成绩比较分散,极差较大; ;乙的成绩相对集中,比较稳定乙的成绩相对集中,比较稳定. .环数环数频率频率0.40.40.30.30.20.20.10.14 5
14、6 7 8 9 10 4 5 6 7 8 9 10 O O(甲)(甲)环数环数频率频率0.40.40.30.30.20.20.10.14 5 6 7 8 9 10 4 5 6 7 8 9 10 O O(乙)(乙) 思考思考3 3:对于样本数据:对于样本数据x x1 1,x x2 2,x xn n,设想通过各数据到其平均数的平均距离来反设想通过各数据到其平均数的平均距离来反映样本数据的分散程度,那么这个平均距离映样本数据的分散程度,那么这个平均距离如何计算?如何计算? 12| |nxxxxxxn-+-+-L含有绝对值,运算不方便含有绝对值,运算不方便. .2标准差与方差标准差与方差(1)标准差:
15、标准差是样本数据到平均数的一种平均距离,一标准差:标准差是样本数据到平均数的一种平均距离,一般用般用s表示,通常用公式表示,通常用公式222121()()() nsxxxxxxn=-+-+-L显然,显然,标准差越大,数据的离散程度越大;标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小;标准差越小,数据的离散程度越小;(2)方差:标准差的平方方差:标准差的平方s2,即即叫做这组数据的方差,叫做这组数据的方差,2222121()()() nsxxxxxxn=-+-+-L方差越大,数据的离散程度越大;方差越大,数据的离散程度越大;方差越小,数据的离散程度越小;方差越小,数据的离散程度越
16、小;易知:易知:s 标 准 差 非 负 : 0;.0标准差为样本数据都相等1230nsxxxx即:【注】【注】2222121()()() nsxxxxxxn=-+-+-L222121()()() nsxxxxxxn=-+-+-L.0方差为样本数据都相等21230nsxxxx即:在数轴上,这两个统计数据有什么几何意义?由此说在数轴上,这两个统计数据有什么几何意义?由此说明标准差的大小对数据的离散程度有何影响?明标准差的大小对数据的离散程度有何影响? 12,2xxx+=212xxs-=标准差越大离散程度越大,数据较分散;标准差越大离散程度越大,数据较分散;思考思考5:对于一个容量为:对于一个容量为
17、2的样本:的样本:x1,x2(x1乙甲又所以乙机床加工的零件质量更加稳定。所以乙机床加工的零件质量更加稳定。 变式变式2 从甲、乙两种玉米苗中各抽从甲、乙两种玉米苗中各抽10株,分别测得株,分别测得它们的株高如下:它们的株高如下:(单位:单位:cm)甲:甲:25414037221419 392142乙:乙:27164427441640401640问:问:(1)哪种玉米的苗长得高?哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?哪种玉米的苗长得齐?1(2541403722141019392142)30 x =+=甲解:(1) 1(27164427441610401640)31x =+=乙 40 x
18、x乙甲222222222221(2530)(4130)(4030)(3730)10(2230)(1430)(1930)(3930)(230)(4230) 104.2s=-+-+-+-+-+-+-+-+-+-=甲 乙种玉米长得高,甲种玉米长得整齐,乙种玉米长得高,甲种玉米长得整齐,22ss乙甲222222222221(2730)(1630)(4430)(2730)10(4430)(1630)(4030)(4030)(1630)(4030) 128.8s=-+-+-+-+-+-+-+-+-+-=乙 【例【例3】已知一组数据:已知一组数据:125121123125127129125128130129
19、126124125127126122124125126128(1)填写下面的频率分布表:填写下面的频率分布表:题型三用频率分布表或直方图求数字特征题型三用频率分布表或直方图求数字特征分组分组频数频数频率频率120.5,122.5)122.5,124.5)124.5,126.5)126.5,128.5)128.5,130.5合计合计(2)作出频率分布直方图;作出频率分布直方图;(3)根据频率分布直方图或频率分布表求这组数据的众数、根据频率分布直方图或频率分布表求这组数据的众数、中位数和平均数中位数和平均数解:解:(1)分组分组频数频数频率频率120.5,122.5)122.5,124.5)124
20、.5,126.5)126.5,128.5)128.5,130.5合计合计 【例【例3】已知一组数据:已知一组数据:125121123125127129125128130129126124125127126122124125126128(1)填写下面的频率分布表:填写下面的频率分布表:频率频率/组距组距0.050.0750.20.10.07523843200.10.150.40.20.151(2) 【例【例3】已知一组数据:已知一组数据:125121123125127129125128130129126124125127126122124125126128(2)作出频率分布直方图;作出频率分布直
21、方图;又又前两个小矩形的频率和为前两个小矩形的频率和为0.25.设第三个小矩形底边的左边设第三个小矩形底边的左边一部分长为一部分长为x.则则x0.20.25,得,得x1.25.中位数中位数为为124.51.25125.75. (事实上,中位数为(事实上,中位数为125.5)(3)在在124.5,126.5)中的数据最多,取这个区间的中点值作为众中的数据最多,取这个区间的中点值作为众数的近似值,得数的近似值,得众数众数为为125.5,(事实上,众数的精确值为(事实上,众数的精确值为125.)121.50.1123.50.15125.50.4127.50.2129.50.15125.8x =+= 平均值125.75x =(事实上,平均值)【题后反思题
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 17215.241-2025电测量设备通用要求、试验和试验条件第41部分:多电能和多费率仪表的电能计度方法和要求
- GB/T 45208-2025饲料中辣椒红的测定高效液相色谱法
- JJF 2187-2025半径样板校准规范
- 出售草坪种子合同范本
- 借款合同范本上交银行
- 2025年西安货运资格证考试答题20题
- 买房时开发商给合同范本
- 农村煤炭采购合同范本
- 包工不包料合同范本
- 公司财产转移合同范本
- 2025年度度假村景观设计及施工一体化合同
- 2025年山东化工职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 《如何规划养禽场》课件
- 2024-2025学年云南省昆明市盘龙区三年级(上)期末数学试卷(含答案)
- 物业公司行政人事部职责
- 医疗健康行业保密免责协议书
- 《设计思维与方法》课件
- 第一课走进人工智能 说课稿 2023-2024学年浙教版(2023)初中信息技术八年级下册
- 健身行业会员权益保障及免责条款协议
- 体检中心前台接待流程
- 2024年大唐集团招聘笔试试题及答案-
评论
0/150
提交评论