用样本的数字特征估计总体的数字特征_第1页
用样本的数字特征估计总体的数字特征_第2页
用样本的数字特征估计总体的数字特征_第3页
用样本的数字特征估计总体的数字特征_第4页
用样本的数字特征估计总体的数字特征_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、222用样本的数字特征估计总体的数字特征(两课时)零号作业一、众数、中位数、平均数1、众数:(1)定义:一组数据中出现次数最多的数称为这组数据的众数.(2)特征:一组数据中的众数可能不止一个,也可能没有,反映了该组数据的集中趋势破疑点众数体现了样本数据的最大集中点,但它对其他数据信息的忽视使其无法客观地反映总体特征.(3)在直方图中为最高矩形下端中点的横坐标2、中位数:(1) 定义:一组数据按从小到大的顺序排成一列,处于中间位置的数称为这组数据的中位数.(2) 特征:一组数据中的中位数是唯一的,反映了该组数据的集中趋势.在频率分布直方图中,中位数左边和右边的直方图的面积相等.破疑点中位数不受少

2、数几个极端值的影响,这在某些情况下是优点,但它对极端值的不敏感有时也会成为缺点.(3)直方图面积平分线与横轴交点的横坐标.左右两边面积各占一半3、 平均数:(1)定义:一组数据的和与这组数据的个数的商.数据Xi, X2,,Xn的平均数为7 xi+ X2+ Xnn =n(2)特征:平均数对数据有“取齐”的作用,代表该组数据的平均水平任何一个数据的改变 都会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来, 平均数可以反映出更多的关于样本数据全体的信息,但平均数受数据中极端值的影响较大,使平均数在估计总体时可靠性降低.(3)直方图中每个小矩形的面积与小矩形底边中点的横坐

3、标的乘积之和二、标准差、方差1、标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用s表示,通常用以下公式来计算s = n【X1 X 2+ X2 X 2+ Xn X 2可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕平均数波动的大小,反映了一组数据变化的幅度和离 散程度的大小.标准差较大,数据的离散程度较大;标准差较小,数据的离散程度较_小.2. 方差(1) 定义:标准差的平方,即 s2=7)(X1 X )2+ (X2 x)2+ (Xn X)2(2) 特征:与标准差的作用相同,描述一组数据围绕平均数波动程度的大小.(3) 取值范围:0 ,+ )3、数据组X1,X2

4、,,Xn的平均数为X,方差为s2,标准差为s,则数据组axr +b, ax2+ b,axn+ b(a, b为常数)的平均数为a x + b,方差为a2,标准差为4、规律总结(1) 用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据.样本的众数、中位数和平均数常用来表示样本数据的“中心值”,其中众数和中位数容易计算,不受少数几个极端值的影响,但只能表达样本数据中的少量信息.平均数代表了数据更多的信息,但受样本中每个数据的影响,越极端的数据对平均数的影响也越大.当样本数据质量比较差时,使用众数、中位数或平均数描述数据的中心位置,可能与实际

5、情况产生较大的误差,难 以反映样本数据的实际状况,因此,我们需要一个统计数字刻画样本数据的离散程度用样本的数字特征估计总体的数字特征,是指用样本的众数、中位数、平均数和标准差等统计数据,估计总体相应的统计数据(2) 平均数对数据有“取齐”的作用,代表一组数据的平均水平.标准差描述一组数据围绕平 均数波动的幅度.在实际应用中,我们常综合样本的多个统计数据,对总体进行估计,为解决 问题作出决策.(3) 标准差越大离散程度越大,数据较分散;标准差越小离散程度越小,数据较集中在平均 数周围.列出一组样本数据的频率分布表步骤说明:1、对同一个总体,可以抽取不同的样本,相应的平均数与标准差都会发生改变.如

6、果样本的代表性差,则对总体所作的估计就会产生偏差;如果样本没有代表性,则对总体作出错误估计的可能性就非常大,由此可见抽样方法的重要性2. 在抽样过程中,抽取的样本是具有随机性的,如从一个包含6个个体的总体中抽取一个容量为3的样本就有20中可能抽样,因此样本的数字特征也有随机性用样本的数字特征估计总体的数字特征,是一种统计思想,没有惟一答案3. 在实际应用中,调查统计是一个探究性学习过程,需要做一系列工作,我们可以把学到的知识应用到自主研究性课题中去.X1 + X2+ + Xn平均水平信息 极端值乘积之和s表示,通常用以下公式来计的作用相同,描述一组数据围绕平均数波动程度的大小.一号作业11、众

7、数(1)定义:一组数据中出现次数 _的数称为这组数据的众数.特征:一组数据中的众数可能_一个,也可能没有,反映了该组数据的_在直方图中为最高矩形下端中点的 _最多 不止集中趋势横坐标2中位数(1)定义:一组数据按从小到大的顺序排成一列,处于 _位置的数称为这组数据的中位数.(2)特征:一组数据中的中位数是 _的,反映了该组数据的 _.在频率分布直方图中,中位数左边和右边的直方图的面积 _.中间 唯一集中趋势 相等3 平均数(1)定义:一组数据的和与这组数据的个数的商数据X1, X2,,Xn的平均数为 x n= _.(2)特征:平均数对数据有“取齐”的作用,代表该组数据的 _任何一个数据的改变都

8、会引起平均数的变化,这是众数和中位数都不具有的性质.所以与众数、中位数比较起来,平均数可以反映出更多的关于样本数据全体的 _,但平均数受数据中 _的影响较大,使平均数在估计总体时可靠性降低.直方图中每个小矩形的面积与小矩形底边中点的横坐标的 _n4. 标准差(1)定义:标准差是样本数据到平均数的一种平均距离,一般用算 S = _可以用计算器或计算机计算标准差.(2)特征:标准差描述一组数据围绕 _波动的大小,反映了一组数据变化的幅度和离散程度的大小.标准差较大,数据的离散程度较 _;标准差较小,数据的离散程度较_ n X1 X 1 2 3+X2 X2+Xn X2平均数 大 小x = 1 500

9、 +331 500+ 591 = 2 091(元)中位数是1 500元,众数是1 500元.5. 方差(1)定义:标准差的平方,即 s2 = _(2) 特征:与(3) 取值范围:k(X1 X )2+ (X2 X )2+ + (Xn X )2 标准差 0 ,+8 )数据组X1, X2,,Xn的平均数为X ,方差为s2,标准差为S,则数据组ax1 + b, ax2+ b, axn+ b(a, b为常数)的平均数为a X + b,方差为a2s2,标准差为as.典例讲解中位数、众数、平均数的应用例1据报道,某公司的33名职工的月工资(以元为单位)如下:职务董事长副董事长董事总经理经理管理员职员人数11

10、215320工资5 5005 0003 5003 0002 5002 0001 500(1)求该公司的职工月工资的平均数、中位数、众数;假设副董事长的工资从 5 000元提升到20 000元,董事长的工资从5 500元提升到30 000 元,那么新的平均数、中位数、众数又是什么?(精确到1元)28 500 + 18 500 + 2 000 X 2+ 1 500+ 1 000X 5 + 500X 3 + 0X 202 平均数是 x = 1 500 +331 500+ 1 788= 3 288(元).中位数是1 500元,众数是1 500元.3 在这个问题中,中位数或众数均能反映该公司职工的工资水

11、平.因为公司中少数人的工资额与大多数人的工资额差别较大,这样导致平均数偏差较大,所以平均数不能反映这个公司职工的工资水平.练习1 :某小区广场上有甲、乙两群市民正在进行晨练,两群市民的年龄如下(单位:岁):甲群 13,13,14,15,15,15,15,16,17,17 ;乙群 54,3,4,4,5,5,6,6,6,57.(1)甲群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映甲群市 民的年龄特征?(3)你认为哪个统计量更能反映这个公司职工的工资水平?结合此问题谈一谈你的看法.解析(1)平均数是4 000+ 3 500+ 2 000 X 2 + 1 500+ 1 000 X

12、 5 + 500 X 3+ 0 X 2015(岁),(2)乙群市民年龄的平均数、中位数和众数各是多少岁?其中哪个统计量能较好反映乙群市 民的年龄特征?答案(1)甲群市民年龄的平均数为13+ 13+ 14+ 15+ 15+ 15+ 15+ 16+ 17+ 17亦=15(岁),中位数为15岁,众数为15岁.平均数、中位数和众数相等,因此它们都能较好地反映甲群市民的年龄特征.(2)乙群市民年龄的平均数为54+ 3+ 4 + 4+ 5+ 5 + 6+ 6+ 6+ 57 _10 =中位数为5岁,众数为6岁.由于乙群市民大多数是儿童,所以中位数和众数能较好地反映乙群市民的年龄特征,而平均数的可靠性较差.例

13、2: (1)甲、乙两人在一次射击比赛中各射靶5次,两人成绩的条形统计图如图所示,则()A 甲的成绩的平均数小于乙的成绩的平均数B. 甲的成绩的中位数等于乙的成绩的中位数C. 甲的成绩的方差小于乙的成绩的方差D.甲的成绩的极差小于乙的成绩的极差(2)某校从参加高二年级学业水平测试的学生中抽出 频率分布直方图如图所示.80名学生,其数学成绩(均为整数)的求这次测试数学成绩的众数.求这次测试数学成绩的中位数.求这次测试数学成绩的平均分.1解析 x 甲=5(4 + 5 + 6 + 7+ 8) = 6,1x 乙=5(5 X 3+ 6+ 9) = 6,甲的中位数是6,乙的中位数是5.1甲的成绩的方差为-(

14、22X 2 + 12X 2) = 2,乙的成绩的方差为-(12X 3 + 32X 1) = 245甲的极差是4,乙的极差是4.所以A , B, D错误,C正确.70 + 80_(2)由图知众数为 2 = 75.由图知,设中位数为 x,由于前三个矩形面积之和为0.4,第四个矩形面积为 0.3,0.3 +0.4 0.5,因此中位数位于第四个矩形内,得 0.1 = 0.03(x 70),所以x 73.3.由图知这次数学成绩的平均分为:40+ 502X 0.005X 10 +50 土 602X 0.015 X 10 +60+ 702X 0.02 X 10 +70+ 802X 0.03X 10 +80+

15、 902X 0.025 X 10 +90+ 1002X 0.005 X 10= 72.答案(1)C(2)见解析练习1:参加市数学调研抽测的某校高三学生成绩分布的茎叶图1和频率分布直方图2均受到不同程度的破坏,但可见部分信息如下,据此解答如下问题:求参加数学抽测的人数n,抽测成绩的中位数及分数分布在80,90), 90,100内的人数.答案分数在50,60)内的频率为2,由频率分布直方图可以看出,分数在 样有2人.2由 = 10 X 0.008,得 n= 25.n由茎叶图可知抽测成绩的中位数为73.分数在80,90)之间的人数为 25 (2 + 7+ 10+ 2) = 4.参加数学竞赛人数n=

16、25,中位数为73,分数在80,90) , 90,100内的人数分一号作业21对于数据 3,3,2,3,6,3,10,3,6,3,2.这组数据的众数是 3;这组数据的众数与中位数的数值都不相等;这组数据的中位数与平均数的数值相等;这组数据的平均数与众数的值相等.其中正确的结论的个数()A. 1 B. 2 C. 3D. 490,100内的同2、为了普及环保知识, 增强环保意识,某大学随机抽取30名学生参加环保知识测试,得分(十分制)如下图所示,假设得分值的中位数为me,众数为mo,平均值为x,则()A . me= mo = x B . me= mo x C. memo x D. mome y ,

17、因此可看出 A药的疗效更+ (39 - 30)4 5+ (21 - 30)2 + (42 - 30)2=祁25 + 121 + 100 + 49 + 64 + 256 + 121 + 81 + 81 + 144)=110 X 1042= 104.2(cm2),1 1s2=石(2 X 272+ 3X 162+ 3X 402 + 2X 442)- 10X 312 = / 1288 = 128.8(cm2).所以 s甲 V 答案(1)乙种玉米的苗长得高,(2)甲种玉米的苗长得齐.练习1 :甲、乙、丙三名射箭运动员在某次测试中各射箭20次,三人的测试成绩如下表:S1, S2, S3分别表示甲、乙、丙三

18、名运动员这次测试成绩的标准差,则有()A. S3S1S2B. S2S1S3C. S1S2S3D. S2S3S14 1x 乙=石(27 + 16 + 44 + 27 + 44 + 16 + 40 + 40 + 16+ 40)=310 = 31(cm).所以x甲V x 乙.30)2 + (41 - 30)2+ (40- 30)2+ (37 - 30)2+ (22 - 30)2+ (14- 30)2 + (19-30)2甲的成绩环数78910频数5555乙的成绩环数78910频数6446丙的成绩环数78910频数4664好.(2)由观测结果可绘制如下茎叶图:从以上茎叶图可以看出,A药疗效的试验结果有

19、 兔的叶集中在茎2,3上,而B药疗效的试验结果有 三的叶集中在茎0,1上,由此可看出 A药的疗效更好.答案B练习2 : 一次数学知识竞赛中,两组学生成绩如下表:分数5060708090100人数甲组251013146标准差、方差的应用例3、从甲、乙两种玉米的苗中各抽10株,分别测它们的株高如下:(单位:cm)甲:25414037221419392142乙:27164427441640401640问:(1)哪种玉米的苗长得高?(2)哪种玉米的苗长得齐?解析看哪种玉米的苗长得高,只要比较甲、乙两种玉米的苗的均高即可;要比较哪种玉米的苗长得齐,只要看两种玉米的苗高的方差即可,因为方差是体现一组数据波

20、动大小的特1 1征数.(1) x 甲=10(25+ 41 + 40 + 37 + 22 + 14+ 19+ 39 + 21 + 42)=300= 30(cm),乙组441621212已经算得两个组的平均分都是80分,请根据你所学过的统计知识,进一步判断这两个组这次竞赛中成绩谁优谁次,并说明理由.答案(1)甲组成绩的众数为 90分,乙组成绩的众数为70分,从成绩的众数比较看,甲组成绩好些.1(2启甲=X 2 X (50 80尸 + 5x (60 80尸 + (70 80)2+ 13 X (80 2+ 5 + 10+ 13+ 14+ 6180)2 + 14X (90 80)2 + 6X (100 80)2 = 50X (2X 900 + 5X400 + 10X 100 + 13X 0 + 14X 100 + 6X 400) = 172.1X (4X 900+ 4X 400+ 16X 100+ 2X 0+ 12X 100+ 12X 400)= 256.50因

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论