第三章 统计假设测验_第1页
第三章 统计假设测验_第2页
第三章 统计假设测验_第3页
第三章 统计假设测验_第4页
第三章 统计假设测验_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、先作处理无效的假设(无效假设)再依据该假先作处理无效的假设(无效假设)再依据该假设概率大小来判断接受或否定该假设的过程称设概率大小来判断接受或否定该假设的过程称为为统计假设测验统计假设测验把试验的表面效应与误差大小相比较并由表面把试验的表面效应与误差大小相比较并由表面效应可能属误差的概率而作出推论的方法称为效应可能属误差的概率而作出推论的方法称为统计推断统计推断备择假设:备择假设:与无效假设相对应的统计假设与无效假设相对应的统计假设00:H 两个样本是从两个具有相同参数的总体两个样本是从两个具有相同参数的总体中随机抽出的,记为:中随机抽出的,记为:210:H 一个样本是从具有平均数一个样本是从

2、具有平均数 的总体中随机抽的总体中随机抽取出来的,记作:取出来的,记作:0 提出假设提出假设计算样本统计数并与计算样本统计数并与有关总体参数比较有关总体参数比较接受无效假设接受无效假设否定无效假设,接受备择假设否定无效假设,接受备择假设可能性大可能性大可能性小可能性小215300330 xxu已知:已知:75 300 152575 nx则则假设:假设:00 :H因为假设是新品种与当地品种不等的可能性,因为假设是新品种与当地品种不等的可能性,所以用两尾概率。查所以用两尾概率。查附表附表3,当,当u2时,概率时,概率界于界于0.04与与0.05之间。之间。设:设: 0.05有:有: 9509619

3、61. xxxp 0250961. xxp 0250961. xxp所以,落在所以,落在 区间(接受区间(接受区)内的有区)内的有95,落在这一区间外的只有,落在这一区间外的只有5。 xx961961. ,否定区:否定区:627015961300961. xx4 .3291596. 130096. 1xx0.030.020.010.00接受区域接受区域否定区域否定区域2.5否定区域否定区域2.5270.6329.4x步骤:步骤:判断是否属于小概判断是否属于小概率事件的概率值率事件的概率值如一尾测验如一尾测验0.05时,应查时,应查附表附表3 p0.10, u1.64(一)两类错误概念(一)两类

4、错误概念第一类错误:不同的参数间本来没有差异,可是测第一类错误:不同的参数间本来没有差异,可是测验结果认为有差异,这种错误称为第一类错误。验结果认为有差异,这种错误称为第一类错误。H0正确,却被拒绝。又称弃真。犯这种错误的概率正确,却被拒绝。又称弃真。犯这种错误的概率记为记为。第二类错误:参数间本来有差异,可是测验结果认第二类错误:参数间本来有差异,可是测验结果认为没有有差异,这种错误称为第二类错误。为没有有差异,这种错误称为第二类错误。 H0错误,却被接受。又称存伪。犯这种错误的概率错误,却被接受。又称存伪。犯这种错误的概率记为记为。(二)两类错误图示(二)两类错误图示c1c20=83%犯犯

5、错误的概率等于显著水平错误的概率等于显著水平以下图为例说明犯以下图为例说明犯错误的概率:错误的概率:96015315432996215315627021.,. uu查附表查附表2,p(u-2.96)=0.0015,p(u0.96)=0.8315,故,故 0.8315-0.00150.83当当 和和0相距较远时,犯相距较远时,犯错误的概率降低错误的概率降低c1c20c1c20300330315285270255345360 0 2(五)两类错误与单、双尾测验的关系(五)两类错误与单、双尾测验的关系(六)现实中避免两类错误的发生(六)现实中避免两类错误的发生一、一、t t分布(分布(t-distr

6、ibutiont-distribution)1 1、概念、概念 在正态总体(方差未知)中随机抽取一在正态总体(方差未知)中随机抽取一系列的小样本,将这些小样本的平均数离差系列的小样本,将这些小样本的平均数离差( )变成标准化离差)变成标准化离差t t,这一系列的,这一系列的 t t 值的分布形成值的分布形成 t t 分布(又叫学生氏分布,分布(又叫学生氏分布,student t distributionstudent t distribution)。 xxsxt nssx 20tt正态分布正态分布=7=3当当 时,时,t t分布近似正态分布。分布近似正态分布。df1, 0tt 1 1、当总体方

7、差、当总体方差 已知,或已知,或 虽未知,虽未知, 但为但为大样本(大样本( ),),用用 u u测验测验 ;2230n2 2、 未知,且为小样本(未知,且为小样本(n n 30t0.05,故,故p0.0551. 0st=2.35接受区接受区否定区否定区否定区否定区推断:否定推断:否定H0:d=1.5m/year,接受,接受HA,即该品,即该品种树苗在阳光直射条件下,每年生长高度不是种树苗在阳光直射条件下,每年生长高度不是1.5m,而是大于,而是大于1.5m。212221)()(2121xxxxu(1 1)两个样本的总体方差)两个样本的总体方差 和和 已知时,已知时,或虽然未知,但为大样本时用

8、或虽然未知,但为大样本时用u u测验测验212222212121nnxx返回28870840124022212121. nnxx(3)计算)计算690288704121212121.)()( xxxxu(4)推断)推断因为实得因为实得|u|0.05,推断:接受,推断:接受无效假设,即两种取样方法所得每平米产无效假设,即两种取样方法所得每平米产量没有显著差异量没有显著差异21)()(2121xxsxxt(2 2)两个样本的总体方差未知,但可以假)两个样本的总体方差未知,但可以假定定 ,而两个样本又为小样本时,而两个样本又为小样本时,用用 t t测验测验。 212221返回221221nsnsse

9、exx 21212SSSSse 库克海峡两小岛上成年雄性大蜥蜴体重调查表(库克海峡两小岛上成年雄性大蜥蜴体重调查表(g)(3)计算相关统计数如下:)计算相关统计数如下:618Ax551Bx17.378532As00.150372Bs78.3024718612211222122221121212BAessnnsnsnSSSSs581711317830247221221. nsnsseexx8205810551618212121.)()()( xxsxxt(4)查附表)查附表4,当,当=n1+n2-2=18时,时,t0.052.101,请,请推断。推断。22212121nsnssxx 222121

10、2121xxsxxt )()(注:注:这种方法用样本均方估计总体方差,所得这种方法用样本均方估计总体方差,所得 t 值不再值不再作准确的作准确的 t 分布,因此在分布,因此在 t t测验时应对自由度测验时应对自由度 进行进行 矫正。矫正。222211xxxsssk 221211kk Satterwaiter 公式公式 221222222212121xxxxssss (2 2)成对比较不受两样本总体方差)成对比较不受两样本总体方差 或或 的干扰,分析时不需要考虑的干扰,分析时不需要考虑 和和 是否相等;是否相等;212222212122(3 3)如将成对数据按成组数据的方法比)如将成对数据按成组

11、数据的方法比较,容易较,容易使统计推断发生第二类错误,即使统计推断发生第二类错误,即不能鉴别应属显著的差异。不能鉴别应属显著的差异。)()(12 nnddsdddsdt 11返回22318183. ddsdt(4)推断)推断查附表查附表4,t0.05(11) 2.201,t t0.05(11),否,否定无效假设,认为该减肥药是有效的。定无效假设,认为该减肥药是有效的。(3)计算)计算2d1.181ddsn n8 . 3dx011181583. ddsdt(4)推断)推断查附表查附表4,t0.1(11) 1.796,|t| 30 ,用,用u检验;检验;()假设()假设(2)显著水平)显著水平(3

12、)计算)计算(4)推断)推断H0:p=0.85即用种衣剂浸种后的发芽率仍为即用种衣剂浸种后的发芽率仍为0.85; HA:p0.85选取显著水平选取显著水平0.05 89. 0500445nxpu 1.96,P 30 ,用,用u检验;检验;()假设()假设(2)显著水平)显著水平(3)计算)计算H0: p1=p2即两块麦田锈病发病率没有显著差异。即两块麦田锈病发病率没有显著差异。 HA: p1 p2选取显著水平选取显著水平0.01 905. 0378342111nxp790. 0396313222nxp846.03963783133422121nnxxp154.01pq026. 0)11(212

13、1nnqpspp在在0.01显著水平上,否定显著水平上,否定H0,接受,接受HA;认为两块麦田锈病发病率有极显著差异,即地认为两块麦田锈病发病率有极显著差异,即地势对小麦锈病的发生有极显著影响作用,低洼势对小麦锈病的发生有极显著影响作用,低洼地小麦锈病的发病率极显著高于高坡地。地小麦锈病的发病率极显著高于高坡地。(4)推断)推断u2.58,P 30 30,不需连续性矫正,当,不需连续性矫正,当 55npnp 或或 nqnq300.05,肯定肯定H0,即实得百分数,即实得百分数0.4与理论百分数与理论百分数0.5没有显著差异没有显著差异(3)计算)计算4 . 0208p(二)两个样本百分数假设测

14、验的连续性(二)两个样本百分数假设测验的连续性矫正矫正2122115050ppcsnxnxt. 1例例:某鱼场发生了药物中毒,:某鱼场发生了药物中毒,检验甲、乙两池发生药物中毒以后,鱼的死亡率检验甲、乙两池发生药物中毒以后,鱼的死亡率是否有显著性差异。是否有显著性差异。抽查甲池中的抽查甲池中的2929尾鱼,有尾鱼,有2020尾死亡尾死亡抽查乙池中的抽查乙池中的2828尾鱼,有尾鱼,有2121尾死亡尾死亡(3)事先不知两池鱼的死亡率孰高孰低,用双尾检验。)事先不知两池鱼的死亡率孰高孰低,用双尾检验。(1)2个样本频率的假设检验;个样本频率的假设检验;(2) 5 np 和和 nq 30 ,需进行连

15、续矫正,需进行连续矫正, 因因n130,n230,用,用t检验;检验;()假设()假设(2)水平)水平(3)计算)计算H0: p1=p2即甲乙两池鱼的死亡率没有显著差异即甲乙两池鱼的死亡率没有显著差异 HA: p1 p2选取显著水平选取显著水平0.05 690. 02920111nxp750. 02821222nxp719. 0282921202121nnxxp281. 01pq119. 0)11(2121nnqpsppdf=29+28-2=55在在0.05显著水平上,接受显著水平上,接受H0,否定,否定HA;认为发生药物中毒后,甲、乙两鱼池鱼的死亡率认为发生药物中毒后,甲、乙两鱼池鱼的死亡率

16、没有显著差异。没有显著差异。(4)推断)推断209. 05 . 05 . 0212121ppcsnnpptt 0.05(55) = 2.004, t c t 0.05(55) 总体平总体平均数的均数的分布分布样本平样本平均数的均数的分布分布抽样分布抽样分布区间估计区间估计1 1、概念、概念(1 1)置信区间:在一定概率保证下,估计出)置信区间:在一定概率保证下,估计出一个范围或区间以能够覆盖参数一个范围或区间以能够覆盖参数 。(2 2)置信限:置信区间的上、下限)置信限:置信区间的上、下限(3 3)置信度:保证该区间能覆盖参数的概率)置信度:保证该区间能覆盖参数的概率 xxuxux , xxstxstx ,21 2121)( ,)(2121xxxxuxxuxxd ddstdstd ,p 21212121xxxxstxxstxx )( ,)( ppupup ,21pp 21212121)( ,)(ppppuppupp链接链接链接链接链接链接链接当总体方差当总体方差 未知

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论