用样本的数字特征估计总体的数字特征1-精讲版课件_第1页
用样本的数字特征估计总体的数字特征1-精讲版课件_第2页
用样本的数字特征估计总体的数字特征1-精讲版课件_第3页
用样本的数字特征估计总体的数字特征1-精讲版课件_第4页
用样本的数字特征估计总体的数字特征1-精讲版课件_第5页
已阅读5页,还剩16页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

2.2.2用样本的数字特征估计总体的数字特征(一)

一、众数、中位数、平均数(1)众数:在样本数据中,频率分布最大值所对应的样本数据或出现次数最多的那个数据。(2)中位数:样本数据中,累计频率为0.5时所对应的样本数据或将数据按大小排列,位于最中间的数据。(3)平均数:样本数据的算术平均数,即例1.从某大型企业全体员工某月的月工资表中随机抽取50名员工工资资料如下:

800800800800800100010001000100010001000100010001000100012001200120012001200120012001200120012001200120012001200120012001200120012001200150015001500150015001500150020002000200020002000250025002500计算这50个数据的众数、中位数和平均数,并估计这个企业员工的平均工资。解:众数是1200,中位数是1200,平均数是这50个数值的和除以50得1320.

估计这个企业员工的平均工资是1320元.

所以用样本的平均数估计总体的平均数是1320元。

同样,再随机抽取50名员工的工资,计算所得的样本平均数一般会与例1中的样本平均数不同。所以用样本的平均数估计总体的平均数时,样本的平均数只是总体的平均数的近似值。

下面我们用来看样本平均数与样本频率直方图的联系。则有nx=x1+x2+……+xn.也就是把每个xi(i=1,2,3,…,n)都用x代替后,数据总和保持不变。

所以平均数x对数据有“取齐”的作用,代表一组数据的数值平均水平。

在频率分布直方图中,平均数是直方图的平衡点,假设横轴是一块放置直方图的跷跷板,则支点取在平均数处时跷跷板达到平衡。我们知道,n个样本数据的平均数例2.某工厂人员及工资构成如下:人员经理管理人员高级技工工人学徒合计周工资2200250220200100人数16510123合计22001500110020001006900(1)指出这个问题中的众数、中位数、平均数;(2)这个问题中,平均数能客观地反映该工厂的工资水平吗?为什么?解:(1)由表格可知:众数为200,中位数为220。平均数为300(元/周)。(2)虽然平均数为300元/周,但由表格中所列出的数据可见,只有经理在平均数以上,其余的人都在平均数以下,故用平均数不能客观真实地反映该工厂的工资水平.三种数字特征的比较:(1)样本众数通常用来表示数据的中心值,容易计算,但是它只能表达样本数据中的很少一部分信息,通常用于描述分离变量的中心位置;(2)中位数不受少数几个极端数据的影响,容易计算,它仅利用了数据中排在中间的数据的信息。(3)平均数受样本中的每一个数据的影响,“越离群”的数据,对平均数的影响也越大,与众数和中位数相比,平均数代表了数据更多的信息,当样本数据质量比较差时,使用平均数描述数据的中心位置可能与实际情况产生较大的误差。

在体育、文艺等各种比赛的评分中,使用的是平均数。计分过程中采用“去掉一个最高分,去掉一个最低分”的方法,就是为了防止个别裁判的人为因素给出过高或过低的分数对选手的得分造成较大的影响,从而降低误差,尽量保证公平性。(4)如果样本平均数大于样本中位数,说明数据中存在许多较大的极端值;反之,说明数据中存在许多较小的极端值。在实际应用中,如果同时知道样本中位数和样本平均数,可以使我们了解样本数据中极端数据的信息,帮助我们作出决策。例3.右面是某校学生日睡眠时间的抽样频率分布表(单位:h),试估计该校学生的日平均睡眠时间。睡眠时间人数频率[6,6.5)50.05[6.5,7)170.17[7,7.5)330.33[7.5,8)370.37[8,8.5)60.06[8.5,9]20.021001解1:总睡眠时间约为6.25×5+6.75×17+7.25×33+7.75×37+8.25×6+8.75×2=739(h)

故平均睡眠时间约为7.39h解2:求各组中值与对应频率之积的和,6.25×0.05+6.75×0.17+7.25×0.33+7.75×37+8.25×0.06+8.75×0.02=7.39(h)

估计该校学生的日平均睡眠时间约为7.39h例4.某单位年收入在10000到15000、15000到20000、20000到25000、25000到30000、30000到35000、35000到40000及40000到50000元之间的职工所占的比分别为10%,15%,20%,25%,15%,10%和5%,试估计该单位职工的平均年收入。解:估计该单位职工的平均年收入为12500×10%+17500×15%+22500×20%+27500×25%+32500×15%+37500×10%+45000×5%=26125(元)答:估计该单位人均年收入约为26125元.练习题:1.若M个数的平均数是x,N个数的平均

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论