教育统计学中的检验(最后的)_第1页
教育统计学中的检验(最后的)_第2页
教育统计学中的检验(最后的)_第3页
教育统计学中的检验(最后的)_第4页
教育统计学中的检验(最后的)_第5页
已阅读5页,还剩52页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

教育(jiàoyù)统计学中的检验T检验(jiǎnyàn)F检验方差分析卡方(x2)检验共五十七页假设检验

第一节假设检验的原理(yuánlǐ)㈠假设与假设检验⒈假设:是根据已知理论与事实对研究对象所作的假定性说明。假设检验中一般有两个相互对立的假设,即研究假设和虚无假设。(1)研究假设假定在总体中存在某种情况,是研究者根据样本信息期望证实的假设,以H1表示。(2)虚无假设与研究假设相对立的假设,是研究者根据样本信息期望拒绝的假设,以H0表示。㈡假设检验的原理与方法:小概率原理假设检验的基本(jīběn)思想是概率性质的反证法。共五十七页㈢假设检验中的两类错误(cuòwù)⒈第Ⅰ类错误:假设H0本来正确,但我们却拒绝它,这种“弃真”错误称为(chēnɡwéi)第Ⅰ类错误。第Ⅰ类错误的概率为α。⒉第Ⅱ类错误:假设H0本来不正确,但我们却接受它,这种“存伪”的错误称为第Ⅱ类错误。第Ⅱ类错误的概率为β。共五十七页㈣双侧检验(jiǎnyàn)和单侧检验(jiǎnyàn)⒈双侧检验:只强调差异而不强调方向性的检验称为(chēnɡwéi)双侧检验。⒉单侧检验:强调某一方向的检验称为单侧检验。又分左侧检验和右侧检验。通常适用于检验某一参数是否“大于”或“优于”、“快于”及“小于”、“劣于”、“慢于”另一参数等一类问题。共五十七页t检验(ttest)是以t分布为理论基础,对一个或两个样本的数值变量资料进行假设检验常用的方法,t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著属于(shǔyú)参数检验。应用条件:(1)样本含量n较小(n<100)(2)总体标准差未知(3)正态分布的总体(4)两总体方差齐性T检验(jiǎnyàn)共五十七页单个样本t检验(jiǎnyàn)配对样本t检验两独立样本t检验T检验(jiǎnyàn)的种类共五十七页

基本原理:即进行样本均数与已知总体均数的比较。目的(mùdì):推断样本所代表的未知总体均数µ与已知的总体均数µ0有无差别。µ0(一般为理论值、标准值或经大量观察所得的稳定值等)

要求:理论上要求资料来自正态分布总体单样本(yàngběn)t检验共五十七页例1:某医生测量(cèliáng)了36名从事铅作业男性工人的血红蛋白含量,算得均数为130.83g/L,标准差为25.74g/L。已知正常成年男性的血红蛋白平均值为140g/L,问从事铅作业工人的血红蛋白平均值是否不同于正常成年男性?分析:样本均数130.83总体均数140共五十七页

(1)建立检验假设,确定检验水准

H0:=0,从事铅作业工人的血红蛋白(xuèhóngdànbái)平均值与正常成年男性相同H1:

0,从事铅作业工人的血红蛋白平均值高于正常成年男性单侧=0.05共五十七页

(3)确定P值,作出统计推断结论以

=n-1=36-1=35,查t界值表,t0.05/2,35=2.030,t>t0.05/2,35,P<0.05,按

=0.05水准拒绝(jùjué)H0,接受H1,差异有统计学意义。可以认为从事铅作业男性工人的血红蛋白含量不同于正常成年男性。即从事铅作业男性工人的血红蛋白含量低于正常成年男性。(2)计算(jìsuàn)统计量共五十七页基本原理:假设两种处理的效应相同,即μ1=μ2,则μ1-μ2=0(即已知总体均数μd=0),检验

差数的样本均数d

与所代表的未知总体均数μd

与0的比较目的(mùdì):推断两种处理的效果有无差别或推断某种处理有无作用要求:差值服从正态分布。配对(pèiduì)t检验共五十七页⑴两个同质受试对象(duìxiàng)分别接受两种不同的处理⑵同一受试对象分别接受两种不同的处理⑶同一受试对象接受某种处理的前后数据⑷同一受试对象的两个不同部位的数据配对设计主要有以下四种(sìzhǒnɡ)情况:共五十七页例2:测得贫血儿童治疗一个疗程前后血红蛋白(g/L),资料见表。试比较(bǐjiào)治疗前后患儿血红蛋白含量有无差别?

资料分析:同一受试对象接受某种处理的前后数据共五十七页患者编号血红蛋白(g/L)差值dd2治疗前治疗后198128309002102136341156383114319614101129287845961313512256941344016007113130172898811193814449741214722091083118441936合计--33511793共五十七页(1)确立假设检验H0:µd=0,即治疗前后患者(huànzhě)血红蛋白含量相同

H1:µd≠0,即治疗前后患者血红蛋白含量不同

=0.05共五十七页共五十七页

以ν=n-1=10-1=9,查t界值表得:t0.05/2,9=2.262,13.305>2.262,故P<0.05,按α=0.05水准,拒绝H0,接受H1,差别有统计学意义。即可以认为治疗前后患者(huànzhě)血红蛋白含量不同,治疗后血红蛋白水平升高,治疗有效。共五十七页基本原理:两样本t检验又称成组t检验,适用(shìyòng)于完全随机设计的两样本均数比较。即两个样本均为随机抽样得到的样本或采用随机分组得到的样本

目的:推断两样本所来自的总体其总体均数是否相同。

要求:样本来自正态总体,两样本均数比较时还要求两样本总体方差齐同。两独立(dúlì)样本均数的t检验共五十七页试比较男女(nánnǚ)的GSH-PX含量两总体均数有无差别⑴建立检验假设,确定检验水准

H0:µ1=µ2,即男女的GSH-PX含量两总体均数相同

H1:µ1≠µ2,即男女的GSH-PX含量两总体均数不同

α=0.05,双侧检验例3:如表

男女(nánnǚ)大学生的血清谷胱甘肽过氧化酶(GSH-PX)

性别例数均数标准差男4896.537.66

女4693.738.23共五十七页⑵选定检验方法,计算检验统计量由于(yóuyú)两组样本量<100,且方差齐,故选用t检验。已知:共五十七页以υ=48+46-2=92查t界值表,

t=1.708<

t

0.05/2(92)=2.000,P>

0.05,按α=0.05水准,不拒绝H0,即差异无统计学意义。可认为男女的GSH-PX含量(hánliàng)相同。⑶确定(quèdìng)P值,作出推断结论

共五十七页两总体(zǒngtǐ)均数比较

方差齐性检验(jiǎnyàn)方差(fānɡchà)齐方差不齐t检验、u检验前提:来自正态总体共五十七页F检验又叫方差齐性检验。在两样本t检验中要用到F检验。从两研究(yánjiū)总体中随机抽取样本,要对这两个样本进行比较的时候,首先要判断两总体方差是否相同,即方差齐性。若两总体方差相等,则直接用t检验,若不等,可采用t'检验或变量变换或秩和检验等方法。判断两总体方差是否相等,就可以用F检验。简单的说就是检验两个样本的方差是否有显著性差异这是选择何种T检验(等方差双样本检验,异方差双样本检验)的前提条件。(适用条件)F检验(jiǎnyàn)共五十七页方差齐性检验的计算公式为:若两样(liǎngyàng)本是来自同一个正态总体,则它们的方差不应相差过大,其F≥→1。由于抽样误差的存在,其F可能会偏离于1,当其偏离过大,超出了抽样误差所能引起的范围,则表明方差不齐。共五十七页不知s1大还是s2大,故齐性检验(jiǎnyàn)应为双侧检验。在样本含量较小时,方差齐性检验不敏感;而在样本含量较大时,方差齐性检验过于敏感。样本含量较大时(n>50),可不做齐性检验。方差齐性检验(jiǎnyàn)的注意要点:

共五十七页⑴建立检验假设,确定检验水准

H0:σ12=σ22,即两组大鼠血糖含量总体(zǒngtǐ)方差相等

H1:σ12≠σ22,即两组大鼠血糖含量总体方差不等α=0.05,双侧检验例4:

两组大鼠血糖含量测定结果(mmol/L)

组别例数均数标准差硫酸氧钒126.51.34

空白对照813.74.21共五十七页⑵选定检验(jiǎnyàn)方法,计算检验(jiǎnyàn)统计量

共五十七页以υ1=7,υ2=11,F=9.87查附表6,F界值表,有9.87>3.01=F0.05,(7,11),故P<0.05。按α=0.05水准,拒绝H0,接受H1差异有统计学意义。故可认为两组大鼠血糖含量总体方差不齐。(故该资料(zīliào)不可直接用方差相等的两样本的t检验)⑶确定(quèdìng)P值,作出推断结论

共五十七页基本原理:两个以上总体均值(jūnzhí)差异的检验。

目的:分析哪些因素(实验处理还是误差)对实验结果产生影响。要求:总体正态分布变异的可加性(变异的可分解性)方差齐性方差分析共五十七页基本原理:在教育和心理研究中,对于实验(shíyàn)中只有一个自变量的数据进行方差分析,称为单因素方差分析,也称作单向方差分析。目的:实验处理的作用下自变量对因变量的影响。类型:完全随机设计的方差分析(随机分组,每组分别接受一种处理)随机区组设计的方差分析(按一定标准划分成多个区组)单因素(yīnsù)方差分析共五十七页基本原理:在教育和心理研究中,某一现象的产生或变化是多因素共同作用的结果,在这种情况下,需要(xūyào)对对多个变量的各个水平间有无显著性差异的进行分析。目的:对两个或多个自变量之间的交互作用,进行评估。类型:完全随机设计随机区组设计多因素(yīnsù)方差分析共五十七页例:某研究者要探讨不同学习环境对男,女生学习效果的影响,假定研究中有两个因素(即两个自变量):一个因素是学习环境(A),它有两个水平,安静的环境(a1)和嘈杂的环境(a2);另一个因素是性别(B),也有两个水平,男(b1)和女(b2)。通过图表分析,学习环境对学习效果有重要影响;嘈杂的环境没有安静的环境学习效果好;可以看出,男女的学习效果没有明显的差别。这是作为单因素来考察时会得出的结论。然而在同时考察两因素时,才能(cáinéng)观察他们之间的真实关系,如在安静的环境下,男女生的学习效果没什么差别,但在嘈杂的环境下,女生的学习效果要比男生好。也就是说,学习环境与性别之间的交互作用下,这是单因素实际无法考虑到的。共五十七页基本原理:检验中的是希腊字母,称为卡方检验,是一种用途较广的计数资料的假设检验方法,属于非参数检验的范畴。可用于两个或多个率间的比较,计数资料的关联度分析,拟合优度检验等等。其根本思想就是在于比较理论频数和实际频数的吻合程度或拟合优度问题(wèntí)。目的:率的假设检验(大样本率或小样本率)要求:

1.随机样本数据;2.卡方检验的理论频数不能太小。卡方检验(jiǎnyàn)共五十七页卡方检验(jiǎnyàn)在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、……,教师职称又分为教授、副教授、……。有时虽有量的关系,因研究需要将其按一定的标准(biāozhǔn)分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准(biāozhǔn)将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。共五十七页特点(tèdiǎn)χ2分布在一象限内,呈正偏态(右偏态),随着参数n的增大,χ2分布趋近于正态分布。χ2分布是连续分布,但有些离散分布也服从χ2分布,尤其在次数统计(tǒngjì)上非常广泛。共五十七页

2检验可以分析试验结果为两种以上(yǐshàng)属性的次数资料的差异显著性①检验两个样本率之间差别的显著性;②检验多个样本率或构成比之间差别的显著性;③检验两个双向无序分类变量是否存在关联;?④配对计数资料的比较。?检验(jiǎnyàn)的应用共五十七页检验实际的频数(pínshù)是否符合某一假设适合性检验检验实际的频数分布是否符合理论分布

2×2表独立性检验独立性检验

r×c表独立性检验分类共五十七页一、定义根据样本中各类频数的分布(fēnbù),对某个理论假设或总体分布(fēnbù)做出的推断。

二、步骤1、建立假设

H0:实际观察的属性类别分配符合已知属性类别分配的理论或学说;

一·适合(shìhé)性检验共五十七页HA:实际观察的属性类别分配不符合已知属性类别分配的理论或学说。2、在无效假设成立的条件下,按已知属性分配的理论或学说计算(jìsuàn)各属性的理论次数和自由度。适合性检验的自由度等于属性分类数(k)减1。3、计算出

2或

2c

4、判断假设成立与否共五十七页类型:检验实际的频数是否符合某一假设例子:在一项关于“学生心目中好老师”的调查中,要求学生从教过他们可得七名老师中选择一位自己最喜欢的老师。共计(ɡònɡjì)调查了280名学生,结果如下。试问7位教师的得票数有否显著差异?

教师(jiàoshī)

A

B

C

DEFG实际票数52484431293046理论票数40404040404040共五十七页解:假设7名教师的得票数无差异(chāyì),即H0:Pi=1/7根据这一假设,每位教师的得票数应该都是40,将其作为理论频数fe,与实得票数一同代入公式:

=14.05这里自由度df=k-1=7-16,查附表,当df=6,

α=0.05时,的临界值为12.59,由于x2>x20.05(6),,则P<0.05.即拒绝假设,可以认为不同教师得票数有显著差异。共五十七页一、独立性检验的意义对次数资料,除了进行(jìnxíng)适合性检验之外,有时需要分析两类因子是相互独立或彼此相关。这种根据次数资料判断两类因子彼此相关或相互独立的假设检验就是独立性检验。二·独立性检验(jiǎnyàn)共五十七页

独立性检验与适合性检验是两种不同的检验方法,除了研究目的不同外,还有以下区别:

(一)资料(zīliào)归组方式不同独立性检验的次数资料是按两因子属性类别进行归组,根据两因子属性类别的不同而构成2×2、2×c、r×c列联表(r为行因子的属性分类数,c为列因子的属性分类数)。共五十七页

适合性检验只按某一因子(yīnzǐ)的属性类别将如性别、表现型等次数资料归组。

(二)理论次数的计算依据不同

适合性检验按已知的属性分类理论或学说计算理论次数。独立性检验在计算理论次数时没有现成的理论或学说可资利用,理论次数是在两因子相互独立的假设下进行计算。共五十七页基本(jīběn)公式:1、2×2表独立性检验(jiǎnyàn)组别阳性数阴性数合计率%甲组aba+b=n1a/n1乙组cdc+d=n2c/n2合计a+cb+dN(a+c)/N共五十七页例:共五十七页H0:π1=π2即试验组与对照组降低颅内压的总体(zǒngtǐ)有效率相等H1:π1≠π2α=0.05。以ν=1查附表8的χ2界值表得P<0.005。按α=0.05检验水准拒绝H0,接受H1,可以认为两组降低颅内压总体有效率不等,即可认为异梨醇口服液降低颅内压的有效率高于氢氯噻嗪+地塞米松的有效率。共五十七页2、r×c表的一般(yībān)形式如下行列总数123…C1O11O12O13…O1CR12O21O22O23…O2CR2…………………rOr1Or2Or3…OrCRr总数C1C2C3…CCn共五十七页式中:i=1,2,…,r;j=1,2,…,cr×c表的独立性检验(jiǎnyàn)的

2计算:共五十七页例例题某医师研究物理疗法、药物治疗和外用膏药三种疗法治疗周围(zhōuwéi)性面神经麻痹的疗效,资料见下表。问三种疗法的有效率有无差别?共五十七页H0:1=2=3=90.4(三组总体有效率相等)H1:三组总体率不等或不全等α=0.05结论:在α=0.05水准,拒绝H0,P<0.01,认为三组疗法有效率不等或不全等。注意:此结果(jiēguǒ)不能得到各两两组比较的结论共五十七页例7某医师在研究血管紧张(jǐnzhāng)素I转化酶(ACE)基因I/D多态(分3型)与2型糖尿病肾病(DN)的关系时,将249例2型糖尿病患者按有无糖尿病肾病分为两组,资料见表7-9。问两组2型糖尿病患者的ACE基因型总体分布有无差别?表9两组Ⅱ型糖尿病患者ACE基因分布比较糖尿病ACE基因型合计DDIDII有肾病42(37.8)48(43.3)21(18.9)111无肾病30(21.7)75(52.2)36(26.1)138合计72(28.9)120(48.

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论