




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、哈尔滨师范大学学 士 论 文题 目 假设检验及其应用学 生 指导教师 年 级 2008级专 业 数学与应用数学系 别 数学系学 院 数学与计算机学院哈尔滨师范大学2011年11月论文提要假设检验是抽样推断中的一项重要内容。它是根据原资料作出一个总体指标是否等于某一个数值,某一随机变量是否服从某种概率分布的假设,然后利用样本资料采用一定的统计方法计算出有关检验的统计量,依据一定的概率原则,以较小的风险来判断估计数值与总体数值(或者估计分布与实际分布)是否存在显著差异,是否应当接受原假设选择的一种检验方法。 用样本指标估计总体指标,其结论有的完全可靠,有的只有不同程度的可靠性,需要进一步加以检验和
2、证实。通过检验,对样本指标与假设的总体指标之间是否存在差别作出判断,是否接受原假设。这里必须明确,进行检验的目的不是怀疑样本指标本身是否计算正确,而是为了分析样本指标和总体指标之间是否存在显著差异。从这个意义上,假设检验又称为显著性检验。假设检验及其应用 摘 要:假设检验是数理统计学中根据一定假设条件由样本推断总体的一种方法。具体作法是:根据问题的需要对所研究的总体作某种假设,记作;选取合适的统计量,这个统计量的选取要使得在假设成立时,其分布为已知;由实测的样本,计算出统计量的值,并根据预先给定的显著性水平进行检验,作出拒绝或接受假设的判断。常用的假设检验方法有u检验法、t检验法、x2检验法、
3、f检验法,秩和检验等 关键词:数学归纳法 归纳原理 历程 应用 推广序言 假设检验亦称“显著性检验(test of statistical significance)”,是 假设检验用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。其基本原理是先对总体的特征作出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受作出推断。 生物现象的个体差异是客观存在,以致抽样误差不可避免,所以我们不能仅凭个别样本的值来下结论。当遇到两个或几个样本均数(或率)、样本均数(率)与已知总体均数(率)有大有小时,应当考虑到造成这种差别的原因有两种可能:一是这两个或几个样
4、本均数(或率)来自同一总体,其差别仅仅由于抽样误差即偶然性所造成;二是这两个或几个样本均数(或率)来自不同的总体,即其差别不仅由抽样误差造成,而主要是由实验因素不同所引起的。假设检验的目的就在于排除抽样误差的影响,区分差别在统计上是否成立,并了解事件发生的概率。 1假设检验的基本思想 假设检验的基本思想是小概率反证法思想。小概率思想是指小概率事件(p0.01或p0.05)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设h0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立,若可能性大,则还不能认为假设不成立。进行假设检验,先要对假设进行陈述。通过下例加以说
5、明。 例如,设某工厂制造某种产品的某种精度服从平均数为方差为的正态分布,据过去的数据,已知平均数为75,方差为100。现在经过技术革新,改进了制造方法,出现了平均数大于75,方差没有变更,但仍存在平均数不超过75的可能性。试陈述为统计假设。根据上述情况,可有两种假设,一个是假想平均数不超过75,即假设另一个假想是平均数大于75,即假设如果我们把作为原假设,即被检验的假设,称作零假设,记作于是,假设相对于假设来说,是约定的、补充的假设,记作它和有两者选择其一的意思,即作为被检验的假设,则就是备择的,故称为备择假设或对立假设。 还须指出,哪个是零假设,哪个是备择假设,是无关紧要的。我们关心的问题,
6、是要探索哪一个假设被接受的问题。被接受的假设是要作为推理的基础。在实际问题中,一般要考虑事情发生的逻辑顺序和关心的事件,来设立零假设和备择假设。 在作出了统计假设之后,就要采用适当的方法来决定是否应该接受零假设。由于运用统计方法所遇到的问题不同,因而解决问题的方法也不尽相同。但其解决方法的基本思想却是一致的,即都是“概率反证法”思想,即: (1)为了检验一个零假设(即虚拟假设)是否成立, 先假定它是成立的,然后看接受这个假设之后,是否会导致不合理结果。如果结果是合理的,就接受它;如不合理,则否定原假设。 (2)所谓导致不合理结果,就是看是否在一次观察中, 出现小概率事件。通常把出现小概率事件的
7、概率记为0,即显著性水平。 它在次数函数图形中是曲线两端或一端的面积。因此,从统计检验来说,就涉及到双侧检验和单侧检验问题。在实践中采用何类检验是由实际问题的性质来决定的。一般可以这样考虑: 双侧检验。如果检验的目的是检验抽样的样本统计量与假设参数的差数是否过大(无论是正方向还是负方向),就把风险平分在右侧和左侧。比如显著性水平为0.05,即概率曲线左右两侧各占,即0.025。 单侧检验。这种检验只注意估计值是否偏高或偏低。如只注意偏低,则临界值在左侧,称左侧检验;如只注意偏高,则临界值在右侧,称右侧检验。 对总体的参数的检量,是通过由样本计算的统计量来实现的。所以检验统计量起着决策者的作用。
8、 1.1小概率原理如果对总体的某种假设是真实的,那么不利于或不能支持这一假设的事件a(小概率事件)在一次试验中几乎不可能发生的;要是在一次试验中a竟然发生了,就有理由怀疑该假设的真实性,拒绝这一假设。 1. 2.假设的形式 h0原假设, h1备择假设 双尾检验:h0: = 0 , 单尾检验: ,h1: 0 假设检验就是根据样本观察结果对原假设(h0)进行检验,接受h0,就否定h1;拒绝h0,就接受h1。2假设检验的原理一般地说,对总体某项或某几项作出假设,然后根据样本对假设作出接受或拒绝的判断,这种方法称为假设检验。 假设检验使用了一种类似于“反证法”的推理方法,它的特点是: (1)先假设总体
9、某项假设成立,计算其会导致什么结果产生。若导致不合理现象产生,则拒绝原先的假设。若并不导致不合理的现象产生,则不能拒绝原先假设,从而接受原先假设。 (2)它又不同于一般的反证法。所谓不合理现象产生,并非指形式逻辑上的绝对矛盾,而是基于小概率原理:概率很小的事件在一次试验中几乎是不可能发生的,若发生了,就是不合理的。至于怎样才算是“小概率”呢?通常可将概率不超过0.05的事件称为“小概率事件”,也可视具体情形而取0.1或0.01等。在假设检验中常记这个概率为,称为显著性水平。而把原先设定的假设成为原假设,记作h0。把与h0相反的假设称为备择假设,它是原假设被拒绝时而应接受的假设,记作h13假设检
10、验的种类假设检验可分为正态分布检验、正态总体均值分布检验、非参数检验三类。 正态分布检验包括三类:jb检验、ks检验、lilliefors检验,用于检验样本是否来自于一个正态分布总体。 正态总体均值检验检验分析方法和分析结果的准确度,考察系统误差对测试结果的影响。从统计意义上来说,各样本均值之差应在随机误差允许的范围之内。反之,如果不同样本的均值之差超过了允许的范围,这就说明除了随机误差之外,各均值之间还存在系统误差,使得各均值之间出现了显著性差异。 正态总体均值检验分为两种情况, t检验是用小样本检验总体参数,特点是在均方差不知道的情况下,可以检验样本平均数的显著性,分为单侧检验与双侧检验。
11、当为双样本检验时,在两样本t检验中要用到f检验。 从两研究总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t检验或变量变换或秩和检验等方法。 若总体服从正态分布n(,),但未知,记,,则t=遵从自由度为n-1的t分布,可对有以下的水平为的检验,其中t为自由度为n-1的t分布的上分位数。这些检验称为t检验。 假设检验z检验是一般用于大样本(即样本容量大于30)平均值差异性检验的方法。 上面所述的检验都是基于样本来自正态总体的假设,在实际工作中,有时并不明确知道样本是否来自正态总体,这就为假设检验带来难度。
12、非参数检验方法,对样本是否来自正态总体不做严格的限制,而且计算简单。统计工具箱提供了符号检验和秩和检验两种非参数检验方法。4 假设检验规则与两类错误4.1 确定检测规则检验过程是比较样本观察结果与总体假设的差异。差异显著,超过了临界点,拒绝h0;反之,差异不显著,接受h0。 差异临界点判断 c拒绝h0 c接受h0 怎样确定c? 4.2 两类错误接受或拒绝h0,都可能犯错误 i类错误弃真错误,发生的概率为 ii类错误取伪错误,发生的概率为 检验决策h0为真h0非真 拒绝h0犯i类错误()正确 接受h0正确犯ii类错误() 大就小,小就大 基本原则:力求在控制前提下减少 显著性水平,取值:0.1,
13、 0.05, 0.001, 等。如果犯i类错误损失更大,为减少损失,值取小;如果犯ii类错误损失更大,值取大。 确定,就确定了临界点c。 设有总体:xn(,2),2已知。 随机抽样:样本均值barxn(mu,sigma2/n)。 标准化: 确定值, 查概率表,知临界值 计算z值,作出判断。 5 假设检验的一般步骤1、提出检验假设(又称无效假设,符号是h0)和备择假设(符号是h1)。 .h0:样本与总体或样本与样本间的差异是由抽样误差引起的; h1:样本与总体或样本与样本间存在本质差异; 预先设定的检验水准为0.05;当检验假设为真,但被错误地拒绝的概率,记作,通常取=0.05或=0.01。 2
14、、选定统计方法,由样本观察值按相应的公式计算出统计量的大小,如x2值、t值等。根据资料的类型和特点,可分别选用z检验,t检验,秩和检验和卡方检验等。 3、根据统计量的大小及其分布确定检验假设成立的可能性p的大小并判断结果。若p,结论为按所取水准不显著,不拒绝h0,即认为差别很可能是由于抽样误差造成的,在统计上不成立;如果p,结论为按所取水准显著,拒绝h0,接受h1,则认为此差别不大可能仅由抽样误差所致,很可能是实验因素不同造成的,故在统计上成立。p值的大小一般可通过查阅相应的界值表得到。 教学中的做法 1.根据实际情况提出原假设和备择假设 2.根据假设的特征,选择合适的检验统计量 3.根据样本
15、观察值,计算检验统计量的观察值(obs) 4.选择许容显著性水平,并根据相应的统计量的统计分布表查出相应的临界值(ctrit) 5.根据检验统计量观察值的位置决定原假设取舍6 假设检验应注意的问题 1、做假设检验之前,应注意资料本身是否有可比性。 2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。 3、根据资料类型和特点选用正确的假设检验方法。 4、根据专业及经验确定是选用单侧检验还是双侧检验。 5、当检验结果为拒绝无效假设时,应注意有发生i类错误的可能性,即错误地拒绝了本身成立的h0,发生这种错误的可能性预先是知道的,即检验水准那么大;当检验结果为不拒绝无效假设时,应注意有发生i
16、i类错误的可能性,即仍有可能错误地接受了本身就不成立的h0,发生这种错误的可能性预先是不知道的,但与样本含量和i类错误的大小有关系。 6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。 7、报告结论时是应注意说明所用的统计量,检验的单双侧及p值的确切范围。 6 参数估计与假设检验统计推断是由样本的信息来推测母体性能的一种方法,它又可以分为两类问题,即参数估计和假设检验。实际生产和科学实验中,大量的问题是在获得一批数据后,要对母体的某一参数进行估计和检验。 例如,我们对45钢的断裂韧性作了测定,取得了一批数据,然后要求45钢断裂韧性的平均值,或要求45钢断裂韧性的单侧
17、下限值,或要求45钢断裂韧性的分散度(即离散系数),这就是参数估计的问题。 又如,经过长期的积累,知道了某材料的断裂韧性的平均值和标准差,经改进热处理后,又测得一批数据,试问新工艺与老工艺相比是否有显著差异,这就是假设检验的问题。 这样可以看出,参数估计是假设检验的第一步,没有参数估计,也就无法完成假设检验。7 假设检验与置信区间的关系假设检验与置信区间有密切的联系,我们往往可以由某参数的显著性水平为的检验,得到该参数的置信度为1的置信区间,反之亦然。例如,显著性水平的均值的双侧检验问题: h0: = 0, 与置信度为1- 的置信区间之间有着这样的关系;若检验在水平下接受h0,则的1 - 的置
18、信区间必须包含0;反之,若检验在 水平下拒绝h0,则的1-的置信区间必定不包含0。因此,我们可以用构造的1-置信区间的方法来检验上述假设,如果构造出来的置信区间包含0,就接受h0;如果不包含0就拒绝h0。同样给定显著水平 ,可以从构造检验规则的过程中,得到的 1-置信区间。 如上例,的置信度为95%的置信区间为: 即置信区间为(80.55 , 85.45),因为0 = 80,不在这个区间内,拒绝h0 8 几种常见的假设检验考虑下面三种类型的假设检验: (4.12) (1)(双边检验) (2)(右侧单边检验) (3)(左侧单边检验) 9 假设检验的应用分析91平均值假设应用 例 在两台不同类型的粗糙度测量仪器上测量同一粗糙度样块的值,由以往经验知道它们的测量值服从正态分布,且,今在这两台仪器上测得同样一块的值如下: 仪 器 甲:1.60,1.63,1.67 ,1.58,1.55,1.63,1.65,1.60,1.58。 仪 器 乙:1.54,1.57,1.60,1.52,1.60,1.62,1.64,1.57. 问这两台仪器测得的ra值的均值有无显著不同。 解:(1)已知待检验假设:。(2)计算统计量
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 室内设计风格选择与实施指南
- 农业生态保护手册
- 项目进度总结与经验分享报告
- 三农合作企业经营管理手册
- 保险行业保险产品设计与管理方案
- 阜阳2025年安徽阜阳临泉县事业单位招聘56人笔试历年参考题库附带答案详解
- 遵义2025年贵州遵义市湄潭县事业单位招聘34人笔试历年参考题库附带答案详解
- 贵州2025年贵州省政协办公厅所属事业单位招聘5人笔试历年参考题库附带答案详解
- 聊城2025年山东聊城高唐县事业单位初级综合类岗位招聘10人笔试历年参考题库附带答案详解
- 温州浙江温州体育运动学校编外工作人员招聘笔试历年参考题库附带答案详解
- 中职高考数学一轮复习讲练测专题一 集合与充要条件(测)原卷版
- 《抽水蓄能电站系统建模与特性分析》6300字(论文)
- 化学-江苏省镇江市2024-2025学年高三下学期期初质量监测试题和答案
- 2025年中考语文一轮复习:民俗类散文阅读 讲义(含练习题及答案)
- 最终版附件1:“跨学科主题学习”教学设计(2025年版)
- 企业财务会计(第四版)教案27:合同成本
- 2025年春季安全教育主题班会教育记录
- 机电一体化专科毕业论文范文
- 医疗入围(药品、耗材集中配送)服务部分方案
- 食品仓储的库房的安全巡检考核试卷
- 财务管理委托代理会计服务 投标文件(技术方案)
评论
0/150
提交评论