03HypothesisTestingppt课件_第1页
03HypothesisTestingppt课件_第2页
03HypothesisTestingppt课件_第3页
03HypothesisTestingppt课件_第4页
03HypothesisTestingppt课件_第5页
已阅读5页,还剩26页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、 假设检验在统计方法中假设检验在统计方法中的地位的地位统计方法统计方法描述统计描述统计推断统计推断统计参数估计参数估计假设检验假设检验课程目标课程目标 什么是假设? 介定 “原假设和“备择假设”. 说明相关术语 什么是假设检验? 假设检验的分类.总体总体: 统计总体统计总体用以定义所有可知或不可知参数用以定义所有可知或不可知参数(m, s)的数据或信息的数据或信息样品样品: 总体中具有共同特征总体中具有共同特征的子集。可以计算其形成的的子集。可以计算其形成的统计表统计表X).应取多少样本?应取多少样本?为何要选取样本?为何要选取样本?样本需要随机抽取吗?样本需要随机抽取吗?可能出现取样可能出现

2、取样错误吗?错误吗?样本样本 A所有的过程都有差异.来源于给定过程的样本也可能是多样化的.样本样本 B我们怎样区分随机变化的样本和真实总体的差别呢? 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比例、方差等 分析之前必需陈述什么是假设什么是假设?(hypothesis)原假设 (Ho)通常用以描述现状除非其它方面有所说明,否则就是人为设想的。在Minitab中用“=”表示备择假设 (Ha ):通常用以描述差別以证据为基础接受或拒绝的类型在Minitab中用“not =or ”表示不是全虚性假设一样就是选择性假设相区别的)不是全虚性假设一样就是选择性假设相区别的)原假设HO: X1=T

3、argetHO: X1=mHO: X1-X2=0HO:m1-m2=0HO: X1=X2=X3=.XnHO: s1=s2HO: S1=S2HO: S1=S2=S3=.Sn备择性假设HA:m1m2 不等式是针对两边的测试HA:X1X2HA:m1m2HA:X1X2 单边测试用于 假设.HA: m1m2HA:X1X2HA: X1-X20 _HA: X1-X20 _HA: s1s2 _HA: s1S2 _把假设以等式陈述很有用把假设以等式陈述很有用. 假设假设双侧检验双侧检验单侧检验单侧检验左侧检验左侧检验右侧检验右侧检验原假设原假设H0 : : m m = m m0 0H0 : : m m m m0

4、0H0 : : m m m m0 0备择假设备择假设H1 : : m m m m0 0H1 : : m m m m0 0【例】一种零件的生产标准是直径应为【例】一种零件的生产标准是直径应为10cm,为对生,为对生产过程进行控制,质量监测人员定期对一台加工机床检产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于零件的平均直径大于或小于10cm,则表明生产过程不,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正正常,必须进行调整。试陈述用来检验生产过程是否正常的原假

5、设和备择假设,并说明你的理由。常的原假设和备择假设,并说明你的理由。【例】某品牌洗涤剂在它的产品说明书中声称:平均净【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于含量不少于500克。从消费者的利益出发,有关研究人克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,并明是否属实。试陈述用于检验的原假设与备择假设,并说明你的理由。说明你的理由。【例】一家研究机构估计,某城市中家庭拥有汽车的比【例】一家研究机构估计,某城市中家庭拥有汽车的比例超过例超过30%。为验证

6、这一估计是否正确,该研究机构随。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,并说明你的理由。与备择假设,并说明你的理由。先对总体的参数(或分布形式)提出某种假设,然后利用样本信息判断假设是否成立的过程有参数检验和非参数检验逻辑上运用反证法,统计上依据小概率原理 什么小概率? 1.在一次试验中,一个几乎不可能发生的事件发生的概率 2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3.小概率由研究者事先确定m m = 50我认为人口的平我认为人口的平均年龄是均年龄是5050岁岁 拒绝假设拒

7、绝假设 别无选择别无选择! 1. 为了改进过程,我们需要确定影响均值和标准偏差的因素.2. 一旦确定了这些因素并对改进措施进行了调整,我们就需要验证其在过程中的切实效果。3. 若过程中存在统计上的重大差别,有时我们就不能利用图表或算得的统计数据样本均值和样本标准偏差作出决策.4. 在这种情况下,决定可能是主观的.5. 我们采用正统假设检验以客观地判断是否存在差別。假设检验有助于判断一个明显的差别是否真实存在还是偶然的,假设检验有助于判断一个明显的差别是否真实存在还是偶然的,而且还可以提高差异真实性的可信度而且还可以提高差异真实性的可信度.数据帮助每个人作出同样的决定。数据帮助每个人作出同样的决

8、定。美国的司法体系可以用于阐述假设检验的概念.在美国罪犯在被判有罪之前均是清白的.清白对应原假设.它需要强而有力的证据,必需“排除所有合理的怀疑才能把被告定罪. 若陪审团裁定被告有罪则相当于拒绝原假设接受备择假设. 更具体些,我们拥有重要的证据证明差別的存在.Ho : 被告是清白的被告是清白的.Ha : 被告有罪被告有罪.当得知真相后,可能的结果是什么当得知真相后,可能的结果是什么?真相真相判决判决Ho, =Ha, not =Ho, =Ha, not =清白清白监禁监禁有罪有罪释放释放清白清白释放释放有罪有罪监禁监禁释放释放监禁监禁清白清白有罪有罪Type I 错误错误 (a 错误错误) 当当

9、 Ho 是无误时而拒绝是无误时而拒绝 有时称作有时称作 生产者风险生产者风险Type II 错误错误 (b 错误错误) 是当是当 Ho有错误时却接受有错误时却接受 有时称作有时称作 消费者风险消费者风险.DecisionType 1错误错误Type 2错误错误正确正确决定决定(1- )正确正确决定决定(1- )真相真相Ho, =Ha, not =Ho, =Ha, not = 1. 第第类错误类错误(弃真错误弃真错误) 原假设为真时拒绝原假设原假设为真时拒绝原假设 第第类错误的概率记为类错误的概率记为 被称为显著性水平被称为显著性水平 2. 第第类错误类错误(取伪错误取伪错误) 原假设为假时未拒

10、绝原假设原假设为假时未拒绝原假设 第第类错误的概率记为类错误的概率记为(Beta)你不能同时减你不能同时减少两类错误少两类错误!1.是一个概率值2.原假设为真时,拒绝原假设的概率被称为抽样分布的拒绝域3.表示为 (alpha)常用的 值有0.01, 0.05, 0.104.由研究者事先确定 衡量决策风险的另一种方法是通过衡量决策风险的另一种方法是通过P值值. P值是指一个因素可测的重要性水平值是指一个因素可测的重要性水平. 当样本和总体相对时,当样本和总体相对时,P值是指观测到其中差別值是指观测到其中差別的机会率的机会率. P值也指如果拒绝虚无性假设可能发生错误的概值也指如果拒绝虚无性假设可能

11、发生错误的概率错误率错误I) 除非在基于工程判断上的例外,我们将错误除非在基于工程判断上的例外,我们将错误I 的的可接受水平定在可接受水平定在a = 0.05. 从而,任何小于从而,任何小于0.05的的P值就表示虚无性假设被值就表示虚无性假设被拒绝。拒绝。置信区间置信区间 确定了总体参数中样本确定了总体参数中样本统计可能的数值范围统计可能的数值范围. 它们可以它们可以是单边也可是双边。是单边也可是双边。122RiskRisk122RiskRiskX111222222RiskRisk111222222RiskRiskX样本均值、样本标准偏差、样本样本均值、样本标准偏差、样本方异和其它样本统计被称

12、为特征方异和其它样本统计被称为特征值评估者。因为它们是用以代表值评估者。因为它们是用以代表总体参数的单一数值。总体参数的单一数值。 所有的估计都有一个范围基于一定的置信度),这个范围即所谓的置信区间。 举个例子:在95%的置信度下估计某样本平均值为100+/-7,换句话说你有95的信心从总体中抽取的样本平均值应落在93107之间。 不同置信水平下的置信区间: 90 95 98 102 105 110-+-+-+-+-+-+- |-70%-| |-80%-| |-90%-| 工程中总存在变异,这些变异通常导致试验结果与目标值之间存在偏移当试验样本无限大时,这种偏移会趋近于零)。 根据某一样本样本

13、大小有限来估计总体样本无限大时的整体的平均值和标准差就是区间估计. 平均值估计: 标准差估计:/2 /2 假设总是关于总体参数的陈述假设总是关于总体参数的陈述.定明原假设定明原假设 (Ho ) HO : A国与国与B国居民身高相等国居民身高相等 (m A = m B ).规定选择性假设规定选择性假设 (Ha )HA : A国居民身高低于国居民身高低于B国居民的身高国居民的身高 (m A m B ).基于在需被测试的假设上,决定适合的统计测试基于在需被测试的假设上,决定适合的统计测试.决定可接受的风险程度决定可接受的风险程度.a 风险风险: 通常通常 5% (默认值默认值)b 风险风险: 通常通常10 20% (默认值默认值)决定适合测试的样本数量从总体中选取需观察的样本群.计算样本的统计.用统计测试方法测验备择假

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论