




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章 统计推断(statistical inference) 假设检验假设检验(hypothesis test)参数估计参数估计(parametric estimation)统计学为什么研究?为什么研究? 首要任务寻求总体特征值总体特征值(参数) 但是总体特征一般难以知道难以知道:(一方面总体很大,即N 很大,有时是无限的,N ,因此不可能逐一调查清楚不可能逐一调查清楚;另一方面有时所要研究的总体目前并不存在,或者只能说是虚拟存在虚拟存在(总体是虚的总体是虚的),无法进行调查无法进行调查,作某一试验时更是如此)。 不管是何种类型的总体,我们总是可以通过不管是何种类型的总体,我们总是可以通过随
2、机抽随机抽样(抽样调查)样(抽样调查)的方法获得该总体的随机样本。的方法获得该总体的随机样本。 通过通过统计推断统计推断来定性或定量地分析所研究来定性或定量地分析所研究总体总体的特的特征值。征值。即:随机抽样即:随机抽样 随机样本随机样本 随机样本特征值随机样本特征值 总体特征值总体特征值 (统计量)(统计量) (参数)(参数) 计算估计假设你正在研究平均一个美国人一生中要得到多少交通罚单,报告研究结果的方法有以假设你正在研究平均一个美国人一生中要得到多少交通罚单,报告研究结果的方法有以下两种:下两种:“10”或者或者“8到到12之间之间”一、参数估计一、参数估计Gudmund R. Iver
3、sen1、点估计、点估计1.用样本的估计量直接作为总体参数的估计值例如:用样本均值直接作为总体均值的估计例如:用样本方差直接作为总体方差的估计2.没有给出估计值接近总体参数程度没有给出估计值接近总体参数程度的信息X2221()1inX XSn2、区间估计、区间估计在点估计的基础上,给出总体参数估计的一个区间范围区间范围,该区间由样本统计量加减抽样误差而得到的根据样本统计量的抽样分布能够对样本统计量与总体参数的接近程度给出一个概率度量n比如,某班级平均分数在7585之间,置信水平是95% ()1()1()11xxxxxP uuxPuuPuxuP xuxu 1)(tsxtPx统计假设检验又称为显著
4、性检验,是生物统计学的核心内容,是统计推断的主要组成部分统计推断(statistical inference)就是通过样本特征(统计量)来推断相应总体特征(参数)的方法n 参数估计(参数估计(parametric estimate) 通过样本统计量估计总体参数的方法通过样本统计量估计总体参数的方法 点估计(点估计(point estimate) 区间估计(区间估计(interval estimate)直接用样本统计量的数值估计出相应总体参数具体值的方法直接用样本统计量的数值估计出相应总体参数具体值的方法在一定的概率保证下(一般为在一定的概率保证下(一般为95%或或99%),根据样本统计量的分布
5、,计),根据样本统计量的分布,计算出总体参数出现的数值范围或区间,用该区间来估计总体参数的方法算出总体参数出现的数值范围或区间,用该区间来估计总体参数的方法 参数估计是对总体参数的参数估计是对总体参数的定量分析定量分析 二、假设检验二、假设检验n 统计假设检验(统计假设检验(hypothesis test) 根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,根据某种实际需要,对未知的或不完全知道的总体参数提出一些假设,然后根据样本观测值和统计量的分布,通过一定的计算,再作出在一定然后根据样本观测值和统计量的分布,通过一定的计算,再作出在一定概率意义上应当接受哪种假设的方法。概率意义
6、上应当接受哪种假设的方法。 统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种:统计假设检验的假设是对总体提出的,由于最后检验的结论只有两种:要比较的总体参数间要么存在显著差异,要么不存在显著差异要比较的总体参数间要么存在显著差异,要么不存在显著差异 统计假设检验是对总体参数的统计假设检验是对总体参数的定性分析定性分析 1. 统计假设检验的意义统计假设检验的意义 以两个平均数之间差异的显著性检验为例以两个平均数之间差异的显著性检验为例现随机挑选10名中国女性和10名韩国女性,请世界网络知名度大赛评委和观众进行知名度评分,试比较哪个国家女性知名度更高?9.999.859.999.959
7、.989.979.959.95中国女性的平均得分9.98韩国女性的平均得分9.91两个国家女性的平均得分并不相等,其差值(表面效应)为:两个国家女性的平均得分并不相等,其差值(表面效应)为: 07. 091. 998. 921 xx根据两个样本平均数的差值根据两个样本平均数的差值0.07,是否可以给两个样本所在总体的总体平,是否可以给两个样本所在总体的总体平均数下这样的结论:均数下这样的结论:中国女性总体的平均得分高于韩国女性总体的平均得分中国女性比韩国女性知名度更高 如果从经典数学的角度来看,答案应该是肯定如果从经典数学的角度来看,答案应该是肯定 如果从生物统计学的角度来看,在未经过统计假设
8、检验以前,只能如果从生物统计学的角度来看,在未经过统计假设检验以前,只能说说“不一定不一定” 事实上,仅仅凭借样本平均数之差不等于事实上,仅仅凭借样本平均数之差不等于0就得出其所属的总体平均数不相就得出其所属的总体平均数不相等是等是不可靠不可靠的的 实际上,进行试验研究的目的并不在于了解样本的结果,而是要通过样本了实际上,进行试验研究的目的并不在于了解样本的结果,而是要通过样本了解总体,解总体,通过样本来推断总体通过样本来推断总体,从而对总体给出一个,从而对总体给出一个全面的结论全面的结论 2. 统计假设检验的基本思想与步骤统计假设检验的基本思想与步骤 首先根据具体试验目的提出一个假设 然后在
9、假定该假设成立(或正确)的前提下进行试验,并取得数据,接着对这些资料进行统计分析,获得该假设成立的概率 最后根据所获得的概率值的大小来判断假设是否成立 如果所得概率较大,就表明我们没有足够的理由来否定所作假设,即必须接受这一假设 如果所得概率较小,就表明这一假设不大可能成立,应予否定,从而接受其对立假设 统计假设检验的基本步骤例3-3:通过以往的大规模调查,已知某地成年黑白花奶牛血液中的白细胞数为52.3,标准差为5.38,现测得10头黑白花牛白细胞数分别为53.6,55.3,46.4,57.2,46.0,43.2,48.1,51.1,49.9,44.5; =49.53。试问这批黑白花奶牛是否
10、来自于某地黑白花奶牛总体?x(1)对所研究的总体提出假设对所研究的总体提出假设研究某一随机样本所在的总体(用研究某一随机样本所在的总体(用表示)和一已知总体(用表示)和一已知总体(用0表示)是表示)是否为同一总体,也就是研究这一随机样本是否来自于已知总体否为同一总体,也就是研究这一随机样本是否来自于已知总体 假设:假设: 两个总体为同一个总体(即两个总体的总体平均数相等)两个总体为同一个总体(即两个总体的总体平均数相等)无效假设(无效假设(null hypothesis) 用用H0表示表示 即即H0:=0 无效假设的含义:无效假设就是假设两总体的平均数相等,即H0:3 .52053.49x3.
11、520假设样本平均数 与已知总体平均数 77. 20 x由抽样误差引起的,并不是两总体之间的真实差异 两总体之间的差异是由抽样误差所引起的为了在无效假设被否定后有可以被接受的假设,因此应在设立无效假设的同为了在无效假设被否定后有可以被接受的假设,因此应在设立无效假设的同时设立一个后备假设时设立一个后备假设 备择假设(备择假设(alternative hypothesis) 用用HA表示表示 即即HA: 3 .52H0A:077. 20 x备择假设的统计学意义:样本所在总体与已知总体不是同一个总体,即两总体的平均数不等,即: 两总体之间的差异是真实差异,而不是由抽样误差引起的 统计假设检验中完整
12、的假设是:统计假设检验中完整的假设是: 00H:0AH:两总体之间的差异是真实差异(2)在假定无效假设成立的前提下,研究样本平均数的抽样分布,计算样在假定无效假设成立的前提下,研究样本平均数的抽样分布,计算样本平均数出现的概率本平均数出现的概率样本平均数与总体平均数间有一个实际存在的差值:样本平均数与总体平均数间有一个实际存在的差值:77. 20 x3 .5202238. 5这个差值就是表面效应,可能是抽样误差,也可能是真实差异,因此需要这个差值就是表面效应,可能是抽样误差,也可能是真实差异,因此需要借助概率原理来进行判断借助概率原理来进行判断 n 第一种方法:计算差值-2.77(或样本平均数
13、)(或样本平均数)出现的概率在无效假设成立的前提下,样本所在的总体与已知总体为同一个总体,因在无效假设成立的前提下,样本所在的总体与已知总体为同一个总体,因此样本所在总体的总体平均数和方差已知,即:此样本所在总体的总体平均数和方差已知,即:xxu070. 13 .5253.4963. 170. 11038. 5nx由于总体方差已知,根据标准正态分布就由于总体方差已知,根据标准正态分布就可以计算出差值可以计算出差值-2.77出现的概率出现的概率 63. 1u0.10.11标准化:构造统计量 正态分布转换为标准正态分布-计算概率n 第二种方法:计算样本平均数的接受区间xxu0根据标准化公式计算样本
14、平均数的接受区间:根据标准化公式计算样本平均数的接受区间:1)(00 xxuxuPxux0 xxuxu00接受区间接受区间xux0否定区间否定区间接受区间和否定区间是有一定的概率保证的,保证概率为接受区间和否定区间是有一定的概率保证的,保证概率为1-,常用的保,常用的保证概率为证概率为95%和和99%;为显著水平,常用的显著水平有为显著水平,常用的显著水平有0.05和和0.01x96. 10倘若样本平均数落在接受区间内,就接受倘若样本平均数落在接受区间内,就接受H0,反之,倘若样本平均数落在,反之,倘若样本平均数落在接受区间之外,就否定接受区间之外,就否定H0,接受,接受HA作为作为0.05显
15、著水平上接受或否定无效假设的两个临界值显著水平上接受或否定无效假设的两个临界值 02.58x作为作为0.01显著水平上接受或否定无效假设的两个临界值显著水平上接受或否定无效假设的两个临界值 1)(uuuP95%的接受区间为:的接受区间为:97.4870. 196. 13 .5296. 10 x68.5670. 158. 23 .5258. 20 x92.4770. 158. 23 .5258. 20 x99%的接受区间为:的接受区间为:63.5570. 196. 13 .5296. 10 x(3)根据根据“小概率事件实际不可能性原理小概率事件实际不可能性原理”接受或否定无效假设接受或否定无效假
16、设小概率事件实际不可能性原理是指在一次试验中,概率很小的事件是不可小概率事件实际不可能性原理是指在一次试验中,概率很小的事件是不可能出现的能出现的 在统计学中,当样本平均数与总体平均数差值出现的概率小于在统计学中,当样本平均数与总体平均数差值出现的概率小于5%时,就认时,就认为这种差异由抽样误差引起的概率较小,而是两总体间的真实性差异,从为这种差异由抽样误差引起的概率较小,而是两总体间的真实性差异,从而否定无效假设而否定无效假设 差值差值-2.77出现的概率为出现的概率为0.10.11,大于,大于0.05,概率较大,概率较大 ;说明样本平均数;说明样本平均数与已知总体的总体平均数之间的差异是抽
17、样误差的概率较大,而不大可能是与已知总体的总体平均数之间的差异是抽样误差的概率较大,而不大可能是真实差异真实差异 接受无效假设,也就是说这批黑白花奶牛是来自于某地黑白花奶牛总体。接受无效假设,也就是说这批黑白花奶牛是来自于某地黑白花奶牛总体。总结:统计假设检验的步骤(1)提出假设)提出假设 (2)构造、计算检验统计量(转换为方便计算概率,如)构造、计算检验统计量(转换为方便计算概率,如u,t值等)值等)(3)查附表,根据小概率原理作出接受或者否定无效假设的推断,并结)查附表,根据小概率原理作出接受或者否定无效假设的推断,并结合专业知识作出合理的、科学的解释合专业知识作出合理的、科学的解释 例4
18、-2:1995年,已知某地20岁应征男青年的平均身高为168.5cm。2005年在当地20岁应征男青年中随机抽取85人,平均身高为171.2cm,标准差为5.3cm,问2005年当地20岁应征男青年的身高与1995年的是否相同?解:解:85n2 .171x5 .16803 . 5S(1)提出假设)提出假设H0:= 168.5HA:168.5与与1995年相比,年相比,2005年当地年当地20岁应征男青年的身高没有变化岁应征男青年的身高没有变化 与与1995年相比,年相比,2005年当地年当地20岁应征男青年的身高有变化岁应征男青年的身高有变化 (2)计算)计算u值值 nSSx575. 0853
19、 . 5xSxu0575. 05 .1682 .17170. 4(3)查表,作出推断)查表,作出推断 u0.05=1.96,u0.01=2.58 |u| = 4.70 2.58 = u0.01, P0.01 根据根据“小概率事件原理小概率事件原理”可以认为无效假设不成立,因此否定无效假设,可以认为无效假设不成立,因此否定无效假设,接受备择假设接受备择假设 样本不是来自于已知总体,即样本不是来自于已知总体,即2005年当地年当地20岁应征男青年的身高有变化,岁应征男青年的身高有变化,比比1995年增高了年增高了 在显著性检验中,否定或接受无效假设的依据是在显著性检验中,否定或接受无效假设的依据是
20、“小概率事件实际不可能性原小概率事件实际不可能性原理理”用来确定否定或接受无效假设的概率标准称为显著水平,记作用来确定否定或接受无效假设的概率标准称为显著水平,记作 若若|u|u0.05 P0.05, 说明表面效应属于试验误差的可能性大,不能否定无效假设,说明表面效应属于试验误差的可能性大,不能否定无效假设,两个总体平均数间两个总体平均数间差异不显著差异不显著 若若u0.05|u|u0.01 P0.05, 说明表面效应属于试验误差的概率说明表面效应属于试验误差的概率P在在0.01-0.05之间,表面效应之间,表面效应属于试验误差的可能性较小,应否定无效假设,接受备择假设属于试验误差的可能性较小
21、,应否定无效假设,接受备择假设 两个总体平均数间两个总体平均数间差异显著差异显著 标记标记 * 若若|u|u0.01 P0.01, 说明表面效应属于试验误差的概率说明表面效应属于试验误差的概率P不超过不超过0.01,表面效应属于,表面效应属于试验误差的可能性更小,应否定无效假设,接受备择假设试验误差的可能性更小,应否定无效假设,接受备择假设 两个总体平均数间两个总体平均数间差异极显著差异极显著 标记标记 * 3. 一尾检验和两尾检验一尾检验和两尾检验 所研究样本的样本平均数,有可能大于已知总体的所研究样本的样本平均数,有可能大于已知总体的总体平均数,也有可能小于已知总体的总体平均数,总体平均数
22、,也有可能小于已知总体的总体平均数,即即计算所得的计算所得的u值可能会落在标准正态分布左边否定值可能会落在标准正态分布左边否定区,也有可能会落在右边否定区区,也有可能会落在右边否定区 既考虑左边否定区又考虑右边否定区即考虑分布既考虑左边否定区又考虑右边否定区即考虑分布曲线两尾的检验称为曲线两尾的检验称为两尾检验两尾检验(two-tailed test)在很多情况下,事先并不知道所抽样本的样本在很多情况下,事先并不知道所抽样本的样本平均数是不是肯定大于总体平均数或肯定小于平均数是不是肯定大于总体平均数或肯定小于总体平均数总体平均数 因此,备择假设因此,备择假设HA:0中,有两种可能性中,有两种可
23、能性存在,既包括存在,既包括0,又包括,又包括0 两尾检验是生物统计学中最常用的方法,应用范围极其广泛两尾检验是生物统计学中最常用的方法,应用范围极其广泛 52.349.53n 两尾检验的假设:两尾检验的假设:H0:=0,HA:0 有些时候,试验目的是明确的,即所抽样本的样本平均数只可能大于总体有些时候,试验目的是明确的,即所抽样本的样本平均数只可能大于总体平均数平均数0,或只可能小于总体平均数,或只可能小于总体平均数0 在这种情况下,无效假设否定后的备择假设只有一种情况:要么在这种情况下,无效假设否定后的备择假设只有一种情况:要么0 ,要,要么么0 只有一个否定区(一尾)的假设检验称为只有一
24、个否定区(一尾)的假设检验称为一尾检验一尾检验(one-tailed test) n 一尾检验的假设:一尾检验的假设:H0:0,HA:0 在在样本容量和显著水平相同样本容量和显著水平相同的情况下,一尾检验的情况下,一尾检验的效率高于两尾检验,一尾检验比两尾检验更容的效率高于两尾检验,一尾检验比两尾检验更容易否定无效假设易否定无效假设 若对同一资料进行两尾检验和一尾检验,那么若对同一资料进行两尾检验和一尾检验,那么在在水平上水平上一尾检验显著一尾检验显著,只相当于,只相当于两尾检验在两尾检验在(查表时双侧(查表时双侧2即可)水平上显著即可)水平上显著。所以,同。所以,同一资料两尾检验与一尾检验所
25、得的结论不一定一资料两尾检验与一尾检验所得的结论不一定相同相同两尾检验显著,一尾检验一定显著两尾检验显著,一尾检验一定显著一尾检验显著,两尾检验未必显著一尾检验显著,两尾检验未必显著 n 一尾检验的假设:一尾检验的假设:H0:0,HA:0 4. 假设检验的两类错误假设检验的两类错误 在假设检验中,接受或者否定无效假设的依据是在假设检验中,接受或者否定无效假设的依据是 “小概率事件实际不可能小概率事件实际不可能性原理性原理”,因此所得出的结论(不论是接受还是否定无效假设)都没有,因此所得出的结论(不论是接受还是否定无效假设)都没有100%的把握,只是在一定的概率范围内认为这种结论是正确的的把握,只是在一定的概率范围内认为这种结论是正确的 4.1 第一类错误第一类错误 如果无效假设如果无效假设H0成立,即成立,即H0:=0为真,但:为真,但: 检验结果发现检验结果发现“差异显著差异显著”而否定了它(此时,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年CFA考试难点试题及答案
- 财务比例分析的应用技巧试题及答案
- 辅助学习的特许金融分析师试题及答案
- 西北旅游区介绍
- 2024年特许金融分析师考试考生技巧题试题及答案
- 员工岗位操作培训
- 特许金融分析师考试学习计划题试题及答案
- 2024年特许金融分析师考试资料准备试题及答案
- 餐饮领班述职报告
- 高校青年教师培训
- 纳布啡在胃肠镜麻醉中的临床观察-课件
- 常用手术器械手工清洗
- 三次函数的图像和性质用
- 纸板线设备基础知识培训53
- 2022年四川省成都市郫都区嘉祥外国语学校八年级下学期期末语文试卷
- 卓越领导力训练
- 数电课程设计报告--- 音乐彩灯控制器
- 注塑成型试题-及答案
- 众智smartgenHAT600系列双电源自动切换控制器说明书
- 湖南省恶性肿瘤门诊放化疗定点医疗机构申请表
- 个体诊所药品清单
评论
0/150
提交评论