第5章参数估计和假设检验_第1页
第5章参数估计和假设检验_第2页
第5章参数估计和假设检验_第3页
第5章参数估计和假设检验_第4页
第5章参数估计和假设检验_第5页
已阅读5页,还剩45页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第5章参数估计和假设检验抽样分布简单随机抽样和简单随机样本的性质无限总体有限总体不放回放 回样本样本放回不放 回样本样本独立性和同一性同一性当n/N5%时,有限总体不放回抽样等同于放回抽样无限总体统计量与抽样分布统计量:即样本指标。样本均值样本成数样本方差如:抽样分布:某一统计量所有可能的样本的取值形成的分布。性 质数字特征0P(Xi)1P(Xi)=1均值E(X) 方差Ex-E(x)2 方差的平方根即抽样分布的标准差就是推断的抽样误差。样本均值的抽样分布(简称均值的分布)抽样总体样本 均值X,(N)均值=Xi/Nx,(n)样本均值是样本的函数,故样本均值是一个统计量,统计量是一个随机变量,样本

2、均值的概率分布称为样本均值的抽样分布。均值分布的数学期望和方差抽 样 方 法 均 值 方 差 标 准差(1)从无限总体抽 样和有限总体放回抽样(2)从有限总体不放回抽样抽样误差抽样误差从正态总体中抽样得到的均值的分布也服从正态分布。从非正态总体中抽样得到的均值的分布呢? 中心极限定理:无论总体为何种分布,只要样本n足够大(n30),均值( )标准化为(z)变量,必定服从标准正态分布,均值( )则服从正态分布,即:关于均值的抽样分布有如下的一些结论:1.对于多数总体分布来说,不论其形态如何,如果样本观察值超过30个,那么均值的抽样分布将近似于正态分布。2.如果总体分布是明显对称的,那么只要样本观

3、察值超过15个,均值的抽样分布也近似于正态分布。 3.如果总体是正态分布的,则不管样本大小如何,均值的抽样分布一定是正态分布的。 两个样本均值之差的抽样分布抽样总体样本X1,(N1)x1,(n1)抽样总体样本X2,(N2)x2,(n2)估计(1)如:(2如果两个总体都是非正态总体,只要n1、n2足够大,根据中心极限定理,可知:样本成数(即比例)的抽样分布(简称成数的分布)抽样总体样本 成数X,(N)成数P=Ni/N x,(n) 所有可能的样本的成数( )所形成的分布,称为样本成数的抽样分布。成数分布的数学期望和方差抽 样 方 法 均 值 方 差 标 准差(1)从无限总体抽 样和有限总体放回抽样

4、(2)从有限总体不放回抽样根据中心极限定理,只要样本足够大, 的分布就近似正态分布。(np和nq大于5时)抽样误差抽样误差两个样本成数之差的抽样分布抽样总体样本X1,(N1)x1,(n1)抽样总体样本X2,(N2)x2,(n2)估计 当n1、n2都足够大时,样本成数 都近似服从正态分布,两个样本成数之差( )也近似服从正态分布。P1-P2=?一个样本方差的抽样分布抽样总体样本若:从一个正态总体中抽样所得到的样本方差的分布n,S2则 当 则 两个样本方差之比的抽样分布抽样总体样本从两个正态总体中分别独立抽样所得到的两个样本方差之比的抽样分布。n1,S12则 抽样总体样本n2,S22参数估计点估计

5、以样本指标直接估计总体参数。评价准则的数学期望等于总体参数,即该估计量称为无偏估计。无偏性有效性当 为 的无偏估计时, 方差 越小,无偏估计越有效。一致性对于无限总体,如果对任意 满足条件则称的一致估计。是充分性一个估计量如能完全地包含未知参数信息,即为充分量估计量点估计常用的求点估计量的方法 1.数字特征法: 当样本容量增大时 ,用样本的数字特征去估计总体的数字特征。 例如,我们可以用样本平均数(或成数)和样本方差来估计总体的均值(或比率)和方差。2.顺序统计量法 : 如果把取得的样本观测值按大小排列起来,那么与排列位置有关的统计量就称为顺序统计量。常用的顺序统计量有样本中位数和极差。 当总

6、体服从正态分布时,用样本中位数来估计总体的数学期望 :3.极大似然估计法: 极大似然估计是根据样本的似然函数对总体参数进行估计的一种方法 。其实质就是根据样本观测值发生的可能性达到最大这一原则来选取未知参数的估计量,其理论依据就是概率最大的事件最可能出现。 区间估计估计未知参数所在的可能的区间。评价准则随机区间置信度精确度随机区间包含(即可靠程度)越大越好。的概率的平均长度(误差范围)越小越好一般形式或总体参数估计值误差范围 :一定倍数的抽样误差例如:抽样误差 一定时,越大,概率(可靠性)大;随之增大,精确度就差。参数的区间估计简单随机抽样待估计参数已知条件置信区间正态总体,2已知正态总体,2

7、未知非正态总体,n30有限总体,n30(不放回抽样)总体均值 ()未知时,用S未知时,用S两个正态总体已知两个正态总体未知但相等两个非正态总体,n1,n230两个总体均值之差1-2简单随机抽样待估计参数已知条件置信区间无限总体,np和nq都大于5总体成数 (p)无限总体, n1p15, n1q1 5n2p25, n2q25两个总体成数之差(P1 - P2)有限总体,np和nq都大于5有限总体, n1p15, n1q1 5n2p25, n2q25简单随机抽样待估计参数已知条件置信区间正态总体总体方差 两个正态总体两个总体方差之比样本数的确定待估计参数已知条件样本数的确定正态总体,2已知总体均值(

8、) 例:误差范围简单随机抽样有限总体,不放回抽样,2已知总体成数 (P)服从正态分布有限总体,不放回抽样 假设检验 基本思想 检验规则 检验步骤 常见的假设检验 方差分析 基本思想小概率原理:如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件A(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中A竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。总 体(某种假设)抽样样 本(观察结果)检验(接受)(拒绝)小概率事件未 发 生小概率事件发 生假设的形式: H0原假设, H1备择假设 双侧检验:H0:=0 , H1:0单侧检验: H0: = 0 , H1:0 H0: =

9、0 , H1:0 假设检验就是根据样本观察结果对原假设(H0)进行检验,接受H0,就否定H1;拒绝H0,就接受H1。 检验规则确定检验规则检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝H0;反之,差异不显著,接受H0差 异临界点拒绝H0接受H0cc判 断两类错误接受或拒绝H0,都可能犯错误I类错误弃真错误, 发生 的概率为 II类错误取伪错误,发生 的概率为检验决策 H0为真 H0非真拒绝H0 犯I类错误() 正确接受H0 正确 犯II类错误() 怎样确定c?大就小,小就大基本原则:力求在控制前提下减少 显著性水平,取值:0.1, 0.05, 0.01, 等。如果犯I

10、类错误损失更大,为减少损失,值取小;如果犯II类错误损失更,值取大。 确定,就确定了临界点c。设有总体:XN(,2),2已知。随机抽样:样本均值标准化:确定值,查概率表,知临界值计算Z值,作出判断0接受区拒绝区拒绝区 当检验判断为接受原假设H0时,就有可能犯取伪的错误即II类错误。确定犯第类错误的概率比较困难 ,具体计算可根据书上的例子。统计上把 称为统计检验的势,它是原假设实际上是错误的应该被拒绝的概率。 II类错误的概率的计算 检验步骤根据具体问题的要求,建立总体假设H0,H112选择统计量确定H0为真时的抽样分布3给定显著性水平,当原假设H0为真时,求出临界值。计算检验统计量的数值与临界

11、值比较4 几种常见的假设检验总体均值的检验条件检验条件量拒绝域H0、H1(1) H0:=0 H1:0z(2) H0: = 0 H1:0(3) H0: = 0 H1:z0z0正态总体2已知总体均值的检验条件检验条件量拒绝域H0、H1(1) H0:=0 H1:0t(2) H0: = 0 H1:0(3) H0: = 0 H1:t0t00正态总体2未知(n30)总体均值的检验条件检验条件量拒绝域H0、H1(1) H0:=0 H1:0z(2) H0: = 0 H1:0(3) H0: = 0 H1:z0z00非正态总体n302已知或未知两个总体均值之差的检验条件检验条件量拒绝域H0、H1(1) H0: 1

12、=2 H1: 1 2 z(2) H0:1 = 2 H1: 1 2 (3) H0: 1 = 2 H1:1 2 z0z00两个正态总体已知两个总体均值之差的检验条件检验条件量拒绝域H0、H1(1) H0: 1 = 2 H1: 1 2 t(2) H0: 1 = 2 H1: 1 2 (3) H0: 1 = 2 H1: 1 2 t0t00两个正态总体未知,但相等两个总体均值之差的检验条件检验条件量拒绝域H0、H1(1) H0:1 = 2 H1:1 2 (2) H0:1 = 2 H1:1 2 (3) H0:1 = 2 H1:1 2 0z00两个非正态体n130 n230已知或未知zz总体成数的检验条件检验

13、条件量拒绝域H0、H1(1) H0:P=P0 H1:PP0z(2) H0:P = P0 H1:PP0(3) H0:P = P0 H1:PP0z0z00np5nq5两个总体成数之差的检验条件检验条件量拒绝域H0、H1(1) H0:P1=P2 H1:P1 P2 z(2) H0: P1 P2 H1:P1 P2(3) H0:P1 P2 H1:P1 P2z0z00n1p15n1q15n2p25n2q25一个总体方差的检验条件检验条件量拒绝域H0、H1总体服从正态分布两个总体方差之比的检验条件检验条件量拒绝域H0、H1总体服从正态分布FFF 方差分析一、问题的提出同一原材料加工产品质量产地各组产品的质量是

14、否有显著差异?随机 原则一个班级 的学生,某门课程的成绩专业 分组各组学生的成绩是否有显著差异?差异随机误差系统误差随机 原则加以比较若存在显著性差异,则说明该因素的影响是显著的二、假定条件各组水平都服从正态分布,均值和方差未知,但方差相同(i=1,2,3, ,k)三、单因素方差分析H0:各水平的均值相等 H1:各水平均值不全相等总离差平方和=组间离差平方和+组内离差平方和 离差平方和:SST= SSB + SSE自由度: n-1 = k-1 + n-k方差: MST MSB MSE检验量=系统误差/随机误差即: F=MSB/MSE检验规则因为:F=3.15 (0.05)所以接受原假设,认为不

15、同的家庭背景对学员成绩没有显著影响。 四、不考虑交互作用的两因素方差分析H0 (A):因素A的k个水平的均值相等 H1 (A): 不全相等总离差平方和=组间离差平方和 +组内离差平方和 离差平方和:SST= SS(A)+SS(B)+ SSE自由度: kh-1 = k-1 +h-1 + (k-1)(h-1)方差: MST MS(A) MS(B) MSE检验量=系统误差/随机误差即: F(A)=MS(A)/MSE F(B)=MS(B)/MSE H0(B): 因素B的h个水平的均值相等 H1(B):不全相等检验规则 因为:F(A)=0.3935.14 F(B)=0.028 (0.05) P(B)(0.99) (0.05)所以接受原假设,认为不同的机器设备和不同的工艺方法对生产量都没有显著影响。 五、考虑交互作用的两因素方差分析H0 (A):因素A的k个水平的均值相等 H1(A):不全相等总离差平方和=组间离差平方和 +组内离差平方和

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论