有限数据统计处理(总体参数估计)第三章_第1页
有限数据统计处理(总体参数估计)第三章_第2页
有限数据统计处理(总体参数估计)第三章_第3页
有限数据统计处理(总体参数估计)第三章_第4页
有限数据统计处理(总体参数估计)第三章_第5页
已阅读5页,还剩37页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、化学化工与生命科学系化学化工与生命科学系任课老师 王丽华实验设计与数据处理第三章 有限数据统计处理3.13.2总体的参数估计总体的参数估计期望值和方差、参数估计期望值和方差、参数估计一般统计检验一般统计检验平均值检验、平均值检验、F检验、离群值检验检验、离群值检验内容内容总体、个体和样本总体、个体和样本:v总体总体(Population):调查研究的事物或现象的全体v个体个体(Item unit):组成总体的每个元素v样本样本(Sample):从总体中所抽取的部分个体v样本容量样本容量(Sample size):样本中所含个体的数量示例:示例:有限数据的统计处理有限数据的统计处理总体总体样本样

2、本甲甲样本容量样本容量平均值平均值500g500g乙乙平行测定平行测定 3 3 次次1x平行测定平行测定 4 4 次次2x丙丙平行测定平行测定 4 4 次次3x有限数据的处理:有限数据的处理:.,.,321321xxxxxx计算计算x估计估计 显著性检验显著性检验没有系统误差,没有系统误差, = T有系统误差,有系统误差, T3.1.1 期望值和方差期望值和方差数据集中趋势的表示:对一数据集中趋势的表示:对一B物质客观存在量为物质客观存在量为T 的分析对象进行的分析对象进行分析,得到分析,得到n 个个别测定值个个别测定值 x1、x2、x3、 xn,平均值平均值 Average niixnx11

3、有限次测量:测量值向有限次测量:测量值向平均值平均值 集中集中无限次测量:测量值向无限次测量:测量值向总体平均值总体平均值 集中集中xn,数据分散程度的表示:数据分散程度的表示:极差极差R R RangeminmaxxxR%100 xRxxdiinxxdnii1%100%xdRMD1)(12nxxsnii100%xsRSD总体标准偏差与标准偏差的比较:总体标准偏差与标准偏差的比较:总体标准偏差nxi2)(标准偏差标准偏差1)(2nxxsi无限次测量,无限次测量,对总体平均值的离散对总体平均值的离散有限次测量有限次测量对平均值的离散对平均值的离散自由度自由度1 nf计算一组数据分散计算一组数据分

4、散度的独立偏差数度的独立偏差数自由度的理解:例如,有三个测量值,求得平均值,也知道自由度的理解:例如,有三个测量值,求得平均值,也知道x1和和x2与与平均值的差值,那么,平均值的差值,那么,x3与平均值的差值就是确定的了,不是一个独与平均值的差值就是确定的了,不是一个独立的变数。立的变数。平均值的标准偏差:平均值的标准偏差:nxnssxS(x)的物理意义:的物理意义:在有限次测量中,每个测量值平均所具有的标准偏差。在有限次测量中,每个测量值平均所具有的标准偏差。对有限次测量:对有限次测量:nssx1、增加测量次数、增加测量次数可以提高精密度。可以提高精密度。2、增加(过多)、增加(过多)测量次

5、数的代价不测量次数的代价不一定能从减小误差一定能从减小误差得到补偿。得到补偿。结论:结论:ssx测量次数测量次数0.00.20.40.60.81.00510152025期望值和方差期望值和方差 在概率论和统计学中,期望值(或数学期望数学期望、或均值均值,亦简称期望期望,物理学中称为期待值期待值)是指在一个离散性随机变量试验中每次可能结果的概率乘以其结果的总和。 换句话说,期望值是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。需要注意的是,期望值并不一定等同于常识中的“期望”“期望值”也许与每一个结果都不相等。(换句话说,期望值是该变量输出值的平均数。期望值并不一定包含于变量

6、的输出值集合里。) 方差(variance)是在概率论和统计方差衡量随机变量或一组数据是离散程度的度量。统计中的方差(样本方差)是各个数据分别与其平均数之差的平方的和的平均数。在许多实际问题中,研究方差即偏离程度有着重要意义。3.1.2 参数估计参数估计估估 计计 方方 法法点点 估估 计计区间估计区间估计 在实际生活中,我们不能通过去测定无限多次去获得在实际生活中,我们不能通过去测定无限多次去获得 和和 2但可但可以利用样本的统计量对总体平均值(以利用样本的统计量对总体平均值( )和方差()和方差( 2)进行估算)进行估算一、点估计一、点估计v从总体中抽取一个样本,根据该样本的统计量对总体的

7、未知参数作出一个数值点的估计例如: 用样本均值作为总体未知均值的估计值就是一个点估计2. 点估计没有给出估计值接近总体未知参数程度的信息v点估计的方法有矩估计法、顺序统计量法、最大似然法、最小二乘法等概念要点:概念要点:被估计的总体参数被估计的总体参数总体参数总体参数符号表示符号表示用于估计的样用于估计的样本统计量本统计量一个总体一个总体均值方差两个总体两个总体均值之差方差比2122212x2s21xx 2221ss估计量的优良性准则估计量的优良性准则v无偏性:无偏性:估计量的数学期望等于被估计的总体参数有效性:有效性:一个方差较小的无偏估计量称为一个更有效的估计量。如,与其他估计量样本相比均

8、值是一个更有效的估计量。v充分性:充分性:作为估计参数用的统计量已经提取了样本中所有可利用的信息(随着样本容量的增大,估计量越来越接近被估计的总体参数 )。 问题:问题:.)(.x在在 的的 内包含内包含 的的有多大?有多大?x对有限次测量对有限次测量1 1、概率、概率2 2、区间界限,多大区间、区间界限,多大区间置信水平置信水平 Confidence level置信度置信度 Degree of confidence Probability level置信区间置信区间 Confidence interval 置信界限置信界限 Confidence limit 必然的联系必然的联系这个问题涉及两

9、个方面:这个问题涉及两个方面:二、区间估计二、区间估计总体平均值的置信区间总体平均值的置信区间概率概率区间大小区间大小00.80 x例:例: 包含在包含在 区间区间 15. 000.8005. 000.80几率相对大几率相对大几率几率 相对小相对小00.80几率为几率为100%无意义无意义平均值的置信区间的问题平均值的置信区间的问题二、区间估计二、区间估计 在实际测定分析中,为了评价测定结果的可靠性,人们总希望能够估计出实际有限次测定的平均值与真实值的接近程度,即在测量值附近估计出真实值可能存在的范围以及试样含量落在此范围内的概率,从而说明分析结果的可靠程度。由此引出置信区间与置信概率的问题。

10、置信区间和置信概率置信区间和置信概率置信区间与置信概率置信区间与置信概率1. 根据一个样本的观察值给出总体参数的估计范围v给出总体参数落在这一区间的概率2.例如: 总体均值落在5070之间,置信度为 95%概念要点:概念要点:置信区间置信区间v无限多次测定中才有总体平均值和总体标准偏差,而实际测定为有限次测定,与未知,只能用有限次测定的平均值及标准偏差S来估计。用S代替引起的误差可用校正系数t来补偿。置信区间和置信概率置信区间和置信概率v总体平均值将包括在区间内,即包括在X平均值附近的某区间内。因此称在 的区间为置信区间。置信区间:在一定置信度下,以测定结果x 为中心的,包括总体平均值在内的可

11、靠性范围。把测定值在置信区间内出现的概率称为把测定值在置信区间内出现的概率称为置信概率置信概率(P),也称为置信度),也称为置信度。置信水平:置信水平: v总体未知参数落在区间内的概率v表示为P= (1-)%l为显著性水平,是总体参数未在区间内的概率v常用的置信水平值有 99%, 95%, 90%l 相应的为为0.01,0.05.0.10置信区间与置信水平:置信区间与置信水平:xxX置信区间与置信概率置信区间与置信概率置信区间与置信概率置信区间与置信概率t 分布表置信区间和置信概率置信区间和置信概率v结论:v(1)根据平均值x,查t可求出 可能存在的范围即置信区间。v(2)测定次数越多、精密度

12、越高、S越小,置信区间就越小,算术平均值和总体平均值 越接近,算术平均值的可靠性就越大,因此用置信区间表示分析结果更合理。v(3)t越小,置信区间越小,校正系数t与自由度有关,f=n-1,测定次数越多,t越小,当n,t分布曲线为正态分布曲线。置信区间和置信概率置信区间和置信概率v结论:v(4)t值随测定次数的增加而减小,随置信概率的提高而增大。当测定次数较少时,可适当增加测定次数,缩小置信区间,从而使测定值的平均值与总体平均值 更接近。v(5)比较两个或多个测定结果的准确程度,应在同一置信概率下进行。v(三)(三)总体平均数总体平均数的区间估计的区间估计v1、大样本大样本条件下的区间估计条件下

13、的区间估计v(1)、总体标准差)、总体标准差已知已知条件下,对总条件下,对总体平均数的区间估计体平均数的区间估计v案例案例2:某茶叶进出口公司,准备处理一:某茶叶进出口公司,准备处理一批库存批库存2年的茶叶,出库之前要进行一次检年的茶叶,出库之前要进行一次检验。检验数据如下;样本容量为验。检验数据如下;样本容量为64包,样包,样本平均数为每包本平均数为每包2公斤,入库记录表明总体公斤,入库记录表明总体标准差为标准差为0.2公斤。经理要求在公斤。经理要求在95%的可信的可信度下,估计一下这批茶叶的平均重量在多度下,估计一下这批茶叶的平均重量在多大范围内?大范围内?解:解: 答:这批茶叶平均重量在

14、答:这批茶叶平均重量在1.9512.049公斤,公斤,其可信程度为其可信程度为95%。(公斤)(公斤)049.2025.096.12951.1025.096.12 ,025.0642.096.1 ,475.02/95.0,95.01 ,2.0,30,6421cctxntnnxxv(2)、总体标准差)、总体标准差未知未知条件下的区间估计条件下的区间估计v总体标准差总体标准差未知条件下,一般用样本标准未知条件下,一般用样本标准差差S代替总体标准差代替总体标准差。v案例:某项抽样调查中获得如下资料:案例:某项抽样调查中获得如下资料: N可以视可以视为无限总体,为无限总体,n=81,样本平均数为,样本

15、平均数为500,样本标,样本标准差为准差为90,求:总体平均数可信度为,求:总体平均数可信度为90%的置信的置信区间。区间。v解:解:v答:此项调查中,总体平均数的可信度为答:此项调查中,总体平均数的可信度为90%的的置信区间是在置信区间是在483.55516.45之间。之间。45.51610645.150055.48310645.1500,108190645.1,500,90,308121cctxnstxsnxxv2、小样本小样本条件下的区间估计条件下的区间估计v(1)、总体标准差)、总体标准差已知已知条件下,对总体条件下,对总体平均数的区间估计平均数的区间估计v使用使用t分布的条件分布的条

16、件:当样本容量:当样本容量n30,且总体标准差,且总体标准差未未知知时,用样本标准差时,用样本标准差S代替总体标准差代替总体标准差。样本标准差。样本标准差S v计算公式:计算公式: 1)x-(xs s 2xnnssxtxxv例例1:从大学一年级学生中随机抽取:从大学一年级学生中随机抽取12名学名学生,其阅读能力得分为生,其阅读能力得分为28,32,36,22,34,30,33,25,31,33,29,26。试评。试评估一下大学一年级学生阅读能力的总体平估一下大学一年级学生阅读能力的总体平均分数。要求置信度分别是均分数。要求置信度分别是95%和和99%。v解:步骤:解:步骤:v(1)计算样本平均

17、数:)计算样本平均数: v(2)计算样本标准差:)计算样本标准差: v(3)计算平均误差:)计算平均误差: v(4)确认自由度:)确认自由度:df=12-1=11,误差概率:,误差概率:v=1-0.95=0.05,查表,查表,t=2.201917.29/nxx1 . 41)(2nxxs184. 1121 . 4nssxv(5)估计总体平均数置信区间:)估计总体平均数置信区间: v解释:有解释:有95%的把握程度说大学一年级学的把握程度说大学一年级学生阅读能力平均分数在生阅读能力平均分数在27.31132.523分之分之间。间。v当当=1-0.99=0.01,查表,查表,t=3.106v29.917-3.1061.184=26.24;29.917+3.1061.184=33.59。523.32311.27 2.606 184. 1201. 2917.29;上限下限xtsx置信区间和置信概率置信区间和置信概率v例:某铵盐含氮量的测定结果x=21.30%,S=0.06%,n=4。求置信概率为95%和99%时平均值的置信区间?若n=10(假定其它数据不变),置信概率为99%时平均值的置信区间为多少? v 置信区间和置信概率置信区间和置信概率v注意:例题结果说明v(1)置信概

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论