江西财经大学统计学课件第八章假设检验.ppt

上传人：q*** IP属地：河南上传时间：2020-02-21 格式：PPT 页数：47 大小：904KB 积分：24 举报 版权申诉

已阅读5页，还剩42页未读，继续免费阅读

版权说明：本文档由用户提供并上传，收益归属内容提供方，若内容存在侵权，请进行举报或认领

文档简介

STAT 第八章假设检验统计实例 STAT 统计实例1988年7月28日的纽约时报上刊登了一篇人们地理知识的文章这篇文章描述了一个由国家地理协会委托Gallup公司所做的研究结果研究者们从一些国家抽取许多成年人并请他们鉴别在一个地图上的16个地方包括13个国家中非波斯湾和太平洋然后把每个人答对的个数加起来四个国家的样本中答对的个数均值为 1 美国 6 9 2 墨西哥 8 2 3 英国 9 0 4 法国 9 2 问题这四个国家在地理知识方面是否存在显著差异 1 由于样本的随机性而导致的 2 这四个国家的人们在此方面确实存在差异第八章假设检验 STAT 实践中我们往往会遇到这样的问题我们根据样本观测得到的一些结论根据经验积累得到的一些认识以及由此得到的一些判断是否成立如居民的收入水平是否提高作物的产量是否增加产品的质量是否上升经济发展的地区差异是否存在现象间的数量关系是否成立事物的发展是否具有某种规律等如何科学客观回答这些问题参数估计与假设检验的联系与区别第八章假设检验 STAT 本章重点 1 假设检验的基本原理正确建立零假设和备择假设理解第一类错误和第二类错误2 大样本情况下单个总体的假设检验3 区间估计与假设检验的关系本章难点 1 假设检验中的P值问题2 小样本情况下的假设检验问题第八章假设检验 STAT 第一节假设检验的基本原理一概念一假设检验假设就是对研究对象的某些特征所做的一种假定或猜想统计假设就是对统计总体分布的某些特征所做的某种假定或论断常见的统计假设总体均值或总体成数总体方差等等于或大于小于某一数值总体我认为到KFC消费的人平均花费2 5美元第八章假设检验 STAT 相关系数等于0 两总体均值或两总体成数两总体方差相等总体分布服从正态正态分布等统计假设检验就是事先对总体参数或总体分布形态做出一个假设然后利用样本提供的信息以一定的概率来检验假设是否成立或是否合理或者说判断总体的真实情况是否与原假设存在显著的系统性差异显著性检验本课程只讨论总体参数的假设检验我从来没有骂过人第八章假设检验 STAT 二原假设和备择假设例1 一名被告即将接受法庭的审判 H0 被告是无罪的H1 被告是有罪的注意两假设能互换吗假设检验检验原假设的正确性例2 某种袋装食品10万袋按规定每袋重量不得低于250克今从中任抽100袋发现有6袋低于250克若规定不符合标准的比例超过5 就不得出厂该批食品能否出厂第八章假设检验 STAT 例3 河下乡统计员报告该乡平均每个农户的家庭年收入为5000元为核实其说法县统计局从该乡随机抽取25户农户得到平均年收入为4650元问该乡统计员的说法是否正确 H0 5000 说法正确 H1 5000 说法不正确有方向吗与例2比较之1 原假设零假设是接受检验的假设是变量间无关系的等价的陈述被告是无罪的我没有骂过人 5000 说法正确是不允许或不应该轻易否定的假设在没有其他信息的情况下原假设被看作可接受的真实状态是研究者怀疑并希望否定的命题第八章假设检验 STAT 原假设的目标是研究的起点是提供与观察到的结果进行比较的基准 2 备择假设研究假设是研究者希望肯定的命题被告是有罪的他骂过人 5000 说法不正确是变量间有关系的不等价的陈述 3 两假设设立的思路哲学上的证实与证伪乌鸦都是黑的波珀与库恩数学上的反证法证A B 设A B 第八章假设检验 STAT 要证明他没有骂过人他必须出示他从小到大每一时刻的录音录像所有书写的东西等等还要证明这些物证是完全的真实的没有间断的这简直是不可能的即使他找到一些证人比如他的同学家人和同事那也只能够证明在那些证人在场的某些片刻他没有被听到骂人反过来如果要证明这个人骂过人很容易只要有一次被抓住就足够了即样本结果与总体假设的矛盾因此企图肯定什么事物很难而否定却相对容易得多这就是假设检验背后的哲学科学往往是在否定中发展设立原假设的动机主要是企图利用人们掌握的样本结果与第八章假设检验 STAT 总体假设的矛盾从而否定这个假设假设检验都是以否定原假设为目标如否定不了说明证据不足无法否定原假设但不能说明原假设正确就像一两次没有听过他骂人还远不能证明他从来没有骂过人备选假设通常是被认为可能比零假设更符合样本数据所代表的现实如H1 m 5 这意味着至少样本均值应该大于5 4 原假设与备择假设的区别原假设是表示变量间无关系的等价的而备择假设是表示变量间有关系的不等价的这是基本的区别原假设总是对应总体的而备择假设总是对应样本的第八章假设检验 STAT 原假设是暗含的假设只能被间接检验间接推论而备择假设是明确的能直接被检验由于上一点你在研究论文中很少看到原假设陈述而总是看到看到备择假设陈述第八章假设检验 STAT 二假设检验的基本原理1 小概率事件原理小概率事件原理一次试验中小概率事件几乎不发生假设检验的关键是看样本统计值与总体参数假设值是否有矛盾出现如果有则否定反之则肯定根据抽样分布理论若原假H0成立则样本统计值与总体参数假设值偏差很大的事件是一个小概率事件一旦在一次抽样中出现小概率事件就要怀疑原假设的正确性从而否定原假设若一次抽样中样本统计值与总体参数假设值相差不大则就没有理由拒绝原假设也就只好接受原假设第八章假设检验 STAT 例 A声称他是一个素食者 H0 A是一个素食者H1 A不是一个素食者 1 只抽一个样本黄瓜判断接受H0 否定H1含义很难拒绝只好含含糊糊地接受或继续调查注意这里接受H0 的说法是不严格的严格的说法是不能拒绝H0 理由后面说明 2 只抽一个样本香肠判断拒绝H0 接受H1 含义绝对无法接受信心十足地拒绝含含糊糊地接受信心十足地拒绝第八章假设检验 STAT 2 显著性水平和拒绝域概率小到多少的事件为小概率事件或说取多大为宜视具体情况而定一般取0 05或0 01 有时也取0 10 把概率小于上述值的事件称为小概率事件越大样本统计值与总体参数假设值之间的差异成为显著性差异的可能性越大反之则小因此的大小就成为判定这种差异是否显著的标准故称显著性水平 1 则为样本统计值与总体参数假设值之差不超过一定范围的概率接受还是拒绝原假最终要以显著性水平为依据确定评判规则评判规则有二种临界值规则和p 值规则即样本统计量抽样分布曲线图中接受域与拒绝域的划分规则第八章假设检验 STAT 临界值规则先把值转化为一定分布下的临界值然后计算检验统计值最后把检验统计值与临界值相比较来判断是否拒绝原假设 p 值规则先计算检验统计值然后求出样本统计量抽样分布曲线图中与检验统计值相对应的称之为观测到的显著性水平p 值最后把p 值与事先给定的显著性水平值相比较来判断是否拒绝原假设本课程只介绍临界值规则 p 值规则不要求掌握第八章假设检验 STAT 例据一调查公司声称2002年某市职工月收入X N 750 2 1502 现随机抽取100名职工计算出其月平均收入为780元问该声称是否可以接受显著性水平 0 05 分析建立假设 H0 750H1 750 质变即显著性差异系统性差异不是由于样本随机性导致的反之量变是随机性差异是不显著的差异程序性错误第八章假设检验 STAT 例一调查公司声称2002年某市职工月收入X N 750 1502 现随机抽取100名职工得其月平均收入为780元问该声称是否可以接受 0 05 H0 750 Z 20Z 2 第八章假设检验 STAT 例一调查公司声称2002年某市职工月收入X N 750 1502 现随机抽取100名职工得其月平均收入为780元问该声称是否可以接受 0 05 H0 750 720 6750779 4 1 9601 96 第八章假设检验 STAT 三两类错误例法官判案过程中的错误H0 被告是无罪的第一类错误判定一个无罪的人有罪第二类错误判定一个有罪的人无罪减小限制警察获取证词的权力防止逼供信或用刑等增大第八章假设检验 STAT 例一调查公司声称2002年某市职工月收入X N 750 1502 现随机抽取100名职工得其平均月收入为780元问该声称是否可以接受 0 05 H0 7501 H0为真 750 样本均值 740 接受样本均值 780 弃真 2 H0为伪 785 720 6750779 4 第八章假设检验 STAT 四检验类型例新生儿的体重服从正态分布根据2002年的统计新生儿的平均体重为3190克现从2003年的新生儿中随机抽取50名测得其平均体重为3210克问2003年的新生儿与2002年相比体重有无显著差异 1 2003 2002 3190 2 2003 2002 3190H0 3190H1 3190 双侧检验过大过小均拒绝第八章假设检验 STAT 例市政府欲购入10万只灯泡按合同规定其使用寿命平均不能低于1000小时已知灯泡使用寿命服从正态分布 2 2002 现从中随机抽取100只测得样本均值为960小时可否认为这批灯泡的平均使用寿命低于1000小时 0 05 H0 1000H1 1000注当样本数据总体数据 0时 H1 0 x0 左单侧检验怕小不怕大第八章假设检验 STAT 例某种袋装食品100万袋按规定每袋重量不得低于250克今从中任抽100袋发现有6袋低于250克若规定不合格率超过5 就不得出厂该批食品能否出厂 0 05 H0 P 5 H1 P 5 注当样本数据总体数据P0时 H1 P P0 PP0 右单侧检验怕大不怕小第八章假设检验 STAT 五假设检验的逻辑步骤 1 写出零假设和备选假设 2 确定检验统计量 3 确定显著性水平a 4 根据样本统计量的概率分布确定与a相对应的临界值即确定接受域和拒绝域 5 根据样本数据计算检验统计值 6 比较检验统计值与临界值做出接受或拒绝原假设的判断第八章假设检验 STAT 附为什么说接受零假设的说法不严格的 1 如果你说接受零假设那么就应该负责任地提供接受零假设时可能犯第二类错误的概率这就要算出在备选假设正确的情况下错误接受零假设的概率但是这只有在备选假设仅仅是一个与零假设不同的确定值而不是范围时才有可能多数统计教科书的备选假设是一个范围而根本无法确定犯第二类错误的概率 2 不能拒绝零假设仅仅说明根据所使用的检验方法或检验统计量和当前的数据没有足够证据拒绝这些假设而已对于同一假设检验问题往往有多个检验统计量而且人们还在构造更优良的检验统计量人们不可能把所有目前存在的和将来可能存在的检验都实施因此只能够说按目前的证据不足以拒绝零假设第八章假设检验 STAT 例一大米加工厂卖给一个超市一批标明10kg重的大米该超市怀疑厂家缺斤短两对10包大米进行了称重得到下面结果单位千克这里假定打包的大米重量服从正态分布 9 939 839 769 9510 079 8910 039 979 89由于发生分歧于是各方同意用这个数据进行大米重量均值m的t检验以厂家所说的平均重量为10kg作为零假设而以超市怀疑的份量不足10kg作为备选假设于是超市加工厂老板和老板的律师都进行了检验结果 1 超市用全部数据进行t检验得到拒绝零假设的结论他们根据计算得到样本均值为9 92kg 而p 值为0 0106 因此超市认为对于显著性水平a 0 05 应该拒绝零假设第八章假设检验 STAT 2 大米加工厂老板只用2个数据得到接受零假设的结论大米加工厂老板也懂些统计他只取了样本的头两个个数目9 93和9 83进行同样的t检验通过这两个数计算得到样本均值为9 88kg 而p 值为0 1257 虽然样本均值不如超市检验的大但p 值大大增加加工厂老板于是下了结论对于水平a 0 05 接受零假设即大米平均重量的确为10kg 3 大米加工厂老板的律师用了全部数据但检验方法不同得到接受零假设的结论律师用全部数据进行连续变量比例的检验即中位数的符号检验注意对于正态分布对中位数的检验等价于对均值的检验根据计算得到该检验的p 值为0 0547 所以律师说在显著性水平a 0 05时应该接受零假设还说既然三个检验中有两个都接受零假设就应该接受第八章假设检验 STAT 加工厂老板实际上减少了作为证据的数据因此只能得到证据不足无法拒绝零假设的结论但加工厂老板利用一些错误的统计教科书的说法把证据不足以拒绝零假设改成接受零假设了而且从样本中仅选择某些数目等于销毁证据违背统计道德律师虽然用了全部数据但用了不同的方法他也只能够说在这个检验方法下证据不足以拒绝零假设而不能说接受零假设另外律师对超市用更有效的检验方法得到的拒绝零假设的结论视而不见这也违背了统计原理其实对于同一个检验问题可能有多种检验方法但只要有一个拒绝就可以拒绝那些不能拒绝的检验方法是能力不足第八章假设检验 STAT 该例说明了几个问题在已经得到样本的情况下随意舍取一些数目是违背统计原理和统计道德的这相当于篡改或销毁证据由于证据不足而不能拒绝零假设绝对不能说成接受零假设如果一定要说请给出接受零假设所可能犯第二类错误的概率是无法算出的这是加工厂老板和律师所犯的错误律师的检验和超市的检验都针对同样的检验问题但由于超市的检验方法比律师的检验更强大或更强势更有效率所以超市拒绝了零假设而律师的检验则不能拒绝如果对同一检验问题有多种检验方法则只要有一个拒绝就必须拒绝绝不能少数服从多数也不能视而不见第八章假设检验 STAT 第二节常用参数的假设检验一单个总体的检验1 正态总体且 2已知例某厂商声称其新开发的钓鱼线的强度服从正态分布且平均强度为8kg 标准差为0 5kg 现从中随机抽出50条测试结果为平均强度为7 85kg 问能否接受厂商的声称 0 05 解 H0 8H1 8 Z 20Z 2 第八章假设检验 STAT 例某厂商声称其新开发的钓鱼线的强度服从正态分布且平均强度 8kg 标准差为0 5kg 现从中随机抽出50条测试结果为平均强度为8 1kg 可否认为其平均强度比8kg高 0 05 解 H0 8H1 8 x0 第八章假设检验 STAT 2 正态总体 2未知例某种金属线的抗拉强度X N 10620 2 据说目前有所下降为此从新生产的产品中任取10根测得样本均值10600kg 样本标准差为81kg 可否认为其抗拉强度比过去下降了 0 05 解 H0 10620H1 10620 1 830 第八章假设检验 STAT 3 非正态分布或总体分布形式未知例一食品加工者关心500g的水果罐头是否装得太满现随机抽取一个容量为50的样本发现平均重量为510g 标准差为8g 试根据0 05的显著性水平检验罐头是否装得太满解 H0 500H1 500 1 645 第八章假设检验 STAT 二单个总体 P的检验一确定假设1 H0 P P0H1 P P02 H0 P P0H1 P P03 H0 P P0H1 P P0 二检验统计量当n很大 30 且np和n 1 p 两者均大于5时第八章假设检验 STAT 例据以往调查购买某企业产品的顾客中30岁以上的男子占50 该企业关心这个比例是否有变于是随机抽取400名顾客进行调查结果有210人为30岁以上的男子该厂希望在0 05的显著性水平下检验 50 的顾客是30岁以上的男子这个假设解 H0 P 50 H1 P 50 1 961 96 第八章假设检验 STAT 三两个总体平均数之差的假设检验不讲一确定假设1 H0 1 2 0H1 1 2 02 H0 1 2 0H1 1 2 03 H0 1 2 0H1 1 2 0 二确定检验统计量正态总体 2未知但相等第八章假设检验 STAT 例两种方法生产的产品抗拉强度都近似服从正态分布方法1的标准差 1 6kg 方法2的标准差 2 8kg 现从方法1和方法2生产的产品中分别抽取容量为12 16的样本其样本均值分别40kg和34kg 管理部门想知道这两种方法生产出来的产品的平均抗拉强度是否相同 0 05 建立假设 H0 1 2 0H1 1 2 0 第八章假设检验 STAT 四两个总体比率之差的假设检验不讲一确定假设1 H0 P1 P2H1 P1 P22 H0 P1 P2H1 P1 P23 H0 P1 P2H1 P1 P2 二检验统计量当n很大 30 且np和n 1 p 两者均大于5时第八章假设检验 STAT 例一保险机构称对于新出台的某一险种沿海地区的人们的喜爱程度要高于内地的人们为此进行的一次抽样调查显示沿海和内地人们的喜爱程度分别为0 65 0 55 样本容量为300 400人可否认为沿海比内地更喜爱这一险种 0 01 建立假设 H0 P1 P2 0H1 P1 P2 0 第八章假设检验 STAT 五正态分布总体方差的假设检验不讲一单个正态总体方差的假设检验1 建立假设 H0 2 02 2 02 双侧检验H0 2 02 2 02 右侧检验H0 2 02 2 02 左侧检验2 构造检验统计量 3 确定决策准则 4 计算统计量的值并决策第八章假设检验 STAT 例某车间生产铜丝生产一向稳定今从中随机抽取10根测得铜丝的折断力均值为575 2 方差为75 73 问是否仍可相

人人文库> 全部分类> 专业文献 > 金融证券

温馨提示

1. 本站所有资源如无特殊说明，都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
2. 本站的文档不包含任何第三方提供的附件图纸等，如果需要附件，请联系上传者。文件的所有权益归上传用户所有。
3. 本站RAR压缩包中若带图纸，网页内容里面会有图纸预览，若没有图纸预览就没有图纸。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 人人文库网仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对用户上传分享的文档内容本身不做任何修改或编辑，并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容，请与我们联系，我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

江西财经大学统计学课件第八章假设检验.ppt

文档简介

温馨提示

最新文档

评论

江西财经大学统计学课件第八章 假设检验.ppt

文档简介

温馨提示

最新文档

评论

相关文档

江西财经大学统计学课件第八章假设检验.ppt