版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第9章 假设检验PowerPoint统计学7/19/20221共九十三页第9章 假设检验一、假设检验的一般问题二、总体(zngt)参数的假设检验三、Excel在假设检验中的应用7/19/20222共九十三页本章学习(xux)目标1.理解假设检验的概念与基本(jbn)思想。2.理解假设检验的两类错误。3.掌握假设检验的方法。4.明确假设检验与区间估计的关系。5.重点掌握总体均值与总体比例的假设检验。 7/19/20223共九十三页要证明他没有骂过人,他必须出示他从小到大每一时刻的录音录像,所有书写的东西等等,还要证明这些物证是完全的、真实的、没有间断的。这简直(jinzh)是不可能的。即使他找到
2、一些证人,比如他的同学、家人和同事,那也只能够证明在那些证人在场的某些片刻,他没有被听到骂人如果一个人说他从来没有骂过人。他能够(nnggu)证明吗?思 考7/19/20224共九十三页反过来,如果要证明这个人骂过人很容易,只要有一次被抓住就足够了。看来,企图肯定什么(shn me)事物很难,而否定却要相对容易得多。这就是假设检验背后的哲学。在假设检验中,一般要设立一个原假设。如上面的“从来没骂过人”就是一个原假设7/19/20225共九十三页设立该假设的动机主要是企图利用人们掌握的反映现实世界的数据来找出现实与假设之间的矛盾,从而否定这个假设。在多数统计教科书中,假设检验都是以否定原假设为目
3、标。如果否定不了,说明(shumng)证据不足,无法否定原假设。但不能说明(shumng)原假设正确。就像一两天没有听过他骂人还远不能证明他从来没有骂过人。7/19/20226共九十三页 一、假设检验的一般(ybn)问题(一)假设检验的概念与特征(二)原假设与备择假设(三)两类错误与显著性水平(四)检验统计(tngj)量与拒绝域(五)假设检验的步骤7/19/20227共九十三页(一)假设检验的概念(ginin)与特征 对总体参数的数值所作的一种陈述总体参数包括总体均值、比例、方差等分析之前(zhqin)必需陈述我认为工艺改革后绳索的拉力强度没有发生显著变化什么是假设?(hypothesis)7
4、/19/20228共九十三页 先对总体参数或分布形式作出一个假设,然后利用样本信息来判断(pndun)原假设是否合理。即判断(pndun)样本信息与原假设是否有显著性差异,从而决定应接受或否定原假设。假设检验也称为显著性检验。 有参数检验和非参数检验,本章只介绍参数检验。 假设检验的概念(ginin)7/19/20229共九十三页假设检验的特征(tzhng) 逻辑上运用反证法统计上依据(yj)小概率原理1.在一次试验中,一个几乎不可能发生的事件发生的概率2.在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设7/19/202210共九十三页. 如果这是总体的真实均值假设检验的基本(jbn)思
5、想115这个值不像我们应该得到的样本均值样本均值96这个值像我们应该得到的样本均值因此,我们应该拒绝(jju)假使=100因此,我们不能拒绝假使=100抽样分布=1007/19/202211共九十三页总体假设检验的过程(guchng)抽取随机样本均值 X = 115牛顿我认为工艺改革后绳索的拉力强度为100牛顿提出假设 拒绝假设! 别无选择.作出决策均值 X = 96牛顿 不拒绝原假设! 作出决策7/19/202212共九十三页(二)原假设(jish)与备择假设(jish)待检验的假设,又称“0假设”通常把事物的原有状况作为原假设 研究者想收集证据予以反对(fndu)的假设4.总是有等号 ,
6、或5.表示为 H0H0: 、 或 某一数值H0: 、 或 某一数值原假设7/19/202213共九十三页与原假设对立的假设,也称“研究假设”通常把期望出现的结论作为备择假设 研究者想收集证据予以(yy)支持的假设。通常是被认为可能比零假设更符合数据所代表的现实。表示为 H1H1: 、”或“”的假设检验,称为单侧检验或单尾检验备择假设的方向为“”,称为右侧检验 双侧检验(jinyn)与单侧检验(jinyn)7/19/202215共九十三页假设双侧检验单侧检验左侧检验右侧检验原假设H0 : m = m0H0 : m m0H0 : m m0备择假设H1 : m m0H1 : m m0假设(jish)
7、的形式7/19/202216共九十三页【例1】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均(pngjn)直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设解:研究者想收集证据予以证明(zhngmng)的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm 7/19/202217共九十三页【例2】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少(b sho)于500克。从消费者的利益出发,有
8、关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设解:研究者抽检的意图是倾向于证实(zhngsh)这种洗涤剂的平均净含量并不符合说明书中的陈述。建立的原假设和备择假设为 H0 : 500 H1 : 1020z=2.4 z=1.645 拒绝H07/19/202247共九十三页1.假定条件 2 未知正态总体大样本(yngbn)或小样本(yngbn)非正态总体大样本使用t检验统计量2未知时t检验法7/19/202248共九十三页3.给定显著性水平,查表得出(d ch)相应的临界值t或t/24.将检验(jinyn)统计量t的值与水平的临界值进行比较,然
9、后作出决策双侧检验:当 时,拒绝H0左侧检验:当 时,拒绝H0右侧检验:当 时,拒绝H07/19/202249共九十三页【例6】一种机床加工的零件尺寸绝对平均误差为1.35mm。厂家采用一种新的机床进行加工以期(y q)进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。试检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01) 左侧(zu c)检验50个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.12
10、1.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.862 未知的总体均值检验 (大样本)7/19/202250共九十三页解:提出(t ch)假设H0 : 1.35H1 : 2400t=1.67 z=1.66 不拒绝H0当n 100时,t分布与标准正态分布很接近,此时也可采用z检验法 7/19/202255共九十三页总体均值(jn zh)的检验 (总结)是否已知假设形式双侧检验左侧
11、检验右侧检验H0 : m =m0H1 : m m0H0 : m m0H1 : m m0 已知统计量 未知拒绝域拒绝域7/19/202256共九十三页假定(jidng)条件是非标志总体,计量结果只有两种情况大样本样本比例的抽样分布可用正态分布来近似总体比例检验的 Z 统计量0为假设的总体(zngt)比例(二)总体比例的假设检验 (z检验法)7/19/202257共九十三页3.给定显著性水平(shupng),查表得出相应的临界值z或z/24.将检验统计量z的值与水平(shupng)的临界值进行比较,然后作出决策双侧检验:当 时,拒绝H0左侧检验:当 时,拒绝H0右侧检验:当 时,拒绝H07/19/
12、202258共九十三页【例9】一种以休闲和娱乐为主题的杂志,声称其读者群中有80%为女性。为验证这一说法是否(sh fu)属实,某研究部门抽取了由200人组成的一个随机样本,发现有146个女性经常阅读该杂志。分别取显著性水平=0.05和=0.01 ,检验该杂志读者群中女性的比例是否为80%?双侧检验(jinyn)7/19/202259共九十三页解:提出假设(jish) H0 : = 80% H1 : 80%根据= 0.05查找正态分布临界值计算(j sun)z检验统计量:该杂志的说法并不属实 作出决策结论:z01.96-1.960.025拒绝 H0拒绝 H00.025z=2.475拒绝H0=
13、0.057/19/202260共九十三页解:提出假设 H0 : = 80% H1 : 80%根据(gnj)= 0.01查找正态分布临界值计算z检验(jinyn)统计量:该杂志的说法属实 作出决策结论:z=2.475不拒绝H0= 0.01z02.58-2.580.005拒绝 H0拒绝 H00.0057/19/202261共九十三页【例10】某产品的不合格品率是8%,企业对该产品的生产设备进行了技术改造,从改造后的产品中随机抽取36件进行检验,发现有次品1件,即次品率为2.778%。能否认为(rnwi)该次技术改造提高了产品的质量? (=0.01) 左侧(zu c)检验7/19/202262共九十
14、三页解:提出(t ch)假设 H0 : 8% H1 : 8%根据= 0.01查找正态分布临界值计算z检验(jinyn)统计量:该技术改造没有显著地提高产品质量 作出决策结论:z=-1.155不拒绝H0-2.33z0拒绝H00.017/19/202263共九十三页总体比率(bl)的检验 (总结)假设形式双侧检验左侧检验右侧检验H0: = 0H1: 0H0 : 0H1 : 0统计量拒绝域2/zza-zzapzzaf7/19/202264共九十三页(三)假设检验中的其他(qt)问题假设检验是统计推断的另一种方式,它与参数估计中区间估计的差别主要在于:区间估计是用给定的大概率推断出总体参数的范围,而假
15、设检验是以小概率为标准,对总体的状况所做出的假设进行判断。假设检验与区间估计结合起来,构成完整(wnzhng)的统计推断内容。推断统计参数估计假设检验7/19/202265共九十三页区间(q jin)估计与假设检验的关系区别: 区间估计:依据样本数据估计总体未知参数(cnsh)的可 能范围 假设检验:根据样本数据检验对总体参数的先验 假设是否成立 区间估计:通常求得的是以样本为中心的双侧置信 区间 假设检验:不仅有双侧检验也有单侧检验 区间估计:立足于大概率,通常以较大的置信度 1- 去估计总体参数的置信区间 假设检验:立足小概率,通常是给定很小的显著性水 平去检验对总体参数的先验假设是否成立
16、7/19/202266共九十三页联系: 都是根据样本信息(xnx)对总体参数进行推断; 都是以抽样分布为理论依据; 都是建立在概率基础上的推断,推断结果都有风险; 7/19/202267共九十三页利用(lyng)置信区间进行检验 (以总体均值为例)求出双侧检验(jinyn)样本均值的1-的置信区间若样本均值在置信区间外,拒绝H0 检验=0是否成立2已知时:2未知时:7/19/202268共九十三页左侧检验:求出样本均值的单边置信(zhxn)下限检验0是否(sh fu)成立若样本均值小于单边置信下限,拒绝H07/19/202269共九十三页检验0是否(sh fu)成立右侧检验:求出样本均值的单边
17、置信(zhxn)上限若样本均值大于单边置信上限,拒绝H07/19/202270共九十三页【例11】一种袋装食品每包的标准重量应为1000克。现从生产的一批产品中随机抽取(chu q)16袋,测得其平均重量为991克。已知这种产品重量服从标准差为50克的正态分布。试确定这批产品的包装重量是否合格?(=0.05)香脆蛋卷(dn jun)双侧检验7/19/202271共九十三页解:提出(t ch)假设 H0:=1000 H1:1000根据=0.05查找正态分布临界值样本均值的置信区间为决策(juc):结论: 样本均值991克包含在置信区间内, 不拒绝H0不能认为这批产品的包装重量不合格Z01.96-
18、1.960.025拒绝 H0拒绝 H00.0257/19/202272共九十三页想一想如何用样本均值构建(u jin)的置信区间来进行假设检验?7/19/202273共九十三页什么(shn me)是P 值?是一个概率值如果原假设为真,P值是抽样分布中大于或小于样本(yngbn)统计量的概率,一般利用计算机来计算双侧检验时,P值是抽样分布中小等于样本统计量的概率的两倍,或为大等于样本统计量的概率的两倍。 左侧检验时,P值为曲线下方小于等于检验统计量部分的面积右侧检验时,P值为曲线下方大于等于检验统计量部分的面积被称为观察到的显著性水平H0 能被拒绝的的最小值用P值进行假设检验7/19/20227
19、4共九十三页p值检验(jinyn)步骤 第一步,提出原假设和备择假设;第二步,根据假设检验的对象选择适当的检验统计(tngj)量,确定其分布形式,并根据样本数据计算检验统计(tngj)量值;第三步,在相应的分布中查找大等于或小等于检验统计量的概率,确定p值; 第四步,比较p值与选择的显著性水平,作出决策。7/19/202275共九十三页 p ,不拒绝(jju)H0 p , 拒绝 H0P值检验(jinyn)的原则 7/19/202276共九十三页/ 2 / 2 Z拒绝拒绝H0值临界值计算出的样本统计量计算出的样本统计量临界值1/2 P 值1/2 P 值双侧检验(jinyn)的P 值7/19/20
20、2277共九十三页H0值临界值a样本统计量拒绝域抽样分布1 - 置信水平计算出的样本统计量P 值左侧(zu c)检验的P 值7/19/202278共九十三页H0值临界值a拒绝域抽样分布1 - 置信水平计算出的样本统计量P 值右侧(yu c)检验的P 值7/19/202279共九十三页【例4】一种罐装饮料采用自动(zdng)生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05,检验该天生产的饮料容量是否符合标准要求?双侧检验(jinyn)绿色健康饮品绿色健康饮品
21、2552552 已知的总体均值的p检验7/19/202280共九十三页解:提出(t ch)假设 H0 : = 255 H1 : 255计算(j sun)检验统计量:作出决策: 结论: p=0.3142= 0.05不拒绝H0我们没有充足理由证明该天生产的饮料不符合标准要求 在正态分布中查找大等于1.01和小等于-1.01的概率,计算p值。p=2*(1-0.8438)=0.3124/ 2 / 2 Z拒绝拒绝0-1.96Z=1.011.961/2 P 值1/2 P 值7/19/202281共九十三页第1步:进入Excel表格界面,直接点击“f(x)”(粘 贴函数)第2步:在函数分类中点击“统计”,并
22、在函数名 的菜单下选择“NORMSDIST”,然后(rnhu)确定第3步:将 z 的绝对值1.01录入,得到的函数值 为0.843752345 ,则: P值=2(1-0.843752345)=0.312495 由于P值远远大于,故不拒绝H0 用Excel计算(j sun)P值7/19/202282共九十三页【例6】一种机床加工的零件尺寸(ch cun)绝对平均误差为1.35mm。厂家采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个进行检验。试检验新机床加工的零件尺寸(ch cun)的平均误差与旧机床相比是否有
23、显著降低? (=0.01) 左侧(zu c)检验50个零件尺寸的误差数据 (mm)1.261.191.310.971.811.130.961.061.000.940.981.101.121.031.161.121.120.951.021.131.230.741.500.500.590.991.451.241.012.031.981.970.911.221.061.111.541.081.101.641.702.371.381.601.261.171.121.230.820.862 未知的总体均值p检验 7/19/202283共九十三页解:提出(t ch)假设H0 : 1.35H1 : 1.35
24、决策(juc): p=0.006=0.01拒绝H0结论:新机床加工的零件尺寸的平均误差与旧机床相比有显著降低 根据df =50-1=49、 =0.01求得t-2.6061概率,即为 p值。P=0.006检验统计量: 7/19/202284共九十三页0-2.33a =0.01z拒绝H0抽样分布1 - 计算出的样本统计量=-2.6061P 值P=0.006 7/19/202285共九十三页 用Excel计算(j sun)P值第1步:进入Excel表格界面,直接点击“f(x)”(粘 贴函数),在函数分类(fn li)中点击“统计”,并在 函数名的菜单下选择“TDIST”,然后确定第2步:在出现对话框
25、的X栏中输入计算出的t的绝 对值2.6061,在Deg-freedom(自由度)栏 中输入本例的自由度49,在Tails栏中输入 1(表明是单侧检验,如果是单测检验则在 该栏输入2) 第3步:点击“确定”,得到P值= 0.006048 P值=0.05,故拒绝H0 7/19/202286共九十三页三、Excel在假设检验中的应用(yngyng)【案例】2008年,统计局公布(gngb)某市的年人均可支配收入为3.2万元。为了解2009年该市人民的收入水平状况,现随机抽取50人进行调查,他们的年可支配收入分别是(万元):2,1.1,0.9,2,2,2,1.5,3.1,3.1,3.1,3.1,3.2
26、,3.2,3.2,3.4,3.4,3.4,3.4,3.4,3.4,3.4,3.5,3.3,3.5,3.6,4,4,5,6,8,8,8,2,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,4,4。试在0.05的显著性水平下检验该市人民的收入水平比2008年是否显著提高? 右侧检验原假设H0 :3.2万元7/19/202287共九十三页 方法(fngf)一:t检验法 利用函数TINV(probabity,degree freedom)第一步,在C2输入“样本均值”,在D2中输入 “=AVERAGE(A1:A50)”,回车(hu ch);第二步,在C4输入“样本标准差”,在D4中输入 “
27、=STDEV(A1:A50)”,回车;第三步,在C6输入“检验统计量t”,在D6中输入 “=(D2-3.2)/(D4/SQRT(50)”,回车;第四步,在C8输入“t分布临界值”,在D8中输入 “=TINV(0.05*2,50-1)”,回车。 由于检验统计量tt临界值,即检验统计量落入接受域,不拒绝H0 。即在0.05的显著性水平下,不能接受2009年收入水平显著提高的结论。7/19/202288共九十三页 方法(fngf)二:t检验法利用函数TDIST(t,degree freedom,tails)第一步,在C2输入“样本均值”,在D2中输入 “=AVERAGE(A1:A50)”,回车;第二
28、步,在C4输入“样本标准差”,在D4中输入 “=STDEV(A1:A50)”,回车;第三步,在C6输入“检验统计量t”,在D6中输入 “=(D2-3.2)/(D4/SQRT(50)”,回车;第四步,在C8输入“t值对应的P值”,在D8中输入 “=TDIST(D6,49,1)”,回车,得p=0.42。 由于P值=0.42=0.05,即检验统计量t值落入接受域,接受H0。即在0.05的显著性水平(shupng)下,不能接受2009年收入水平(shupng)显著提高的结论 P检验法7/19/202289共九十三页,第一步,在C2输入“样本均值”,在D2中输入 “=AVERAGE(A1:A50)”,回车;第二步,在C4输入“样本标准差”,在D4中输入 “=STDEV(A1:A50)”,回车;第三步,在C6输入“检验(jinyn)统计量z”,在D6中输入 “=(D2-3.2)/(D4/SQRT(50)”回车,得z=0.204;第四步,在C8输入“标准正态
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论