第十四讲检验_第1页
第十四讲检验_第2页
第十四讲检验_第3页
第十四讲检验_第4页
第十四讲检验_第5页
已阅读5页,还剩107页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第十三讲T检验t分布的特点⑴.形状与正态分布曲线相似⑵.t分布曲线随自由度不同而有一簇曲线⑶.自由度的计算:自由度是指能够独立变化的数据个数。⑷.查t分布表时,需根据自由度及相应的显著性水平,并要注意是单侧数据还是双侧。四.总体参数估计(一)总体参数估计原理根据样本统计量对相应总体参数所作的估计叫作总体参数估计。总体参数估计分为点估计和区间估计。由样本的标准差估计总体的标准差即为点估计;而由样本的平均数估计总体平均数的取值范围则为区间估计。1.良好的点估计量应具备的条件无偏性

如果一切可能个样本统计量的值与总体参数值偏差的平均值为0,这种统计量就是总体参数的无偏估计量。有效性

当总体参数不止有一种无偏估计量时,某一种估计量的一切可能样本值的方差小者为有效性高,方差大者为有效性低。

良好的点估计量应具备的条件一致性当样本容量无限增大时,估计量的值能越来越接近它所估计的总体参数值,这种估计是总体参数一致性估计量。充分性一个容量为n的样本统计量,应能充分地反映全部n个数据所反映的总体的信息。2.区间估计以样本统计量的抽样分布(概率分布)为理论依据,按一定概率的要求,由样本统计量的值估计总体参数值的所在范围,称为总体参数的区间估计。对总体参数值进行区间估计,就是要在一定可靠度上求出总体参数的置信区间的上下限。⑴要知道与所要估计的参数相对应的样本统计量的值,以及样本统计量的理论分布;⑵要求出该种统计量的标准误;⑶要确定在多大的可靠度上对总体参数作估计,再通过某种理论概率分布表,找出与某种可靠度相对应的该分布横轴上记分的临界值,才能计算出总体参数的置信区间的上下限。置信区间置信度,即置信概率,是作出某种推断时正确的可能性(概率)。置信区间,也称置信间距(confidenceinterval,CI)是指在某一置信度时,总体参数所在的区域距离或区域长度。置信区间是带有置信概率的取值区间。显著性水平对总体平均数进行区间估计时,置信概率表示做出正确推断的可能性,但这种估计还是会有犯错误的可能。显著性水平(significancelevel)就是指估计总体参数落在某一区间时,可能犯错误的概率,用符号α表示。

P=1-α3.平均数区间估计的基本原理通过样本的平均数估计总体的平均数,首先假定该样本是随机取自一个正态分布的母总体(或非正态总体中的n>30的样本),而计算出来的实际平均数是无数容量为n的样本平均数中的一个。根据样本平均数的分布理论,可以对总体平均数进行估计,并以概率说明其正确的可能性。(二)总体平均数的区间估计1.总体平均数区间估计的基本步骤①.根据样本的数据,计算样本的平均数和标准差;②.计算平均数抽样分布的标准误;③.确定置信概率或显著性水平;④.根据样本平均数的抽样分布确定查何种统计表;⑤.计算置信区间;⑥.解释总体平均数的置信区间。2.平均数区间估计的计算①总体正态,σ已知(不管样本容量大小),或总体非正态,σ已知,大样本平均数离差的的抽样分布呈正态,平均数的置信区间为:(9.1)五、假设检验的基本原理利用样本信息,根据一定概率,对总体参数或分布的某一假设作出拒绝或保留的决断,称为假设检验。1.假设假设检验一般有两互相对立的假设。H0:零假设,或称原假设、虚无假设(nullhypothesis)、解消假设;是要检验的对象之间没有差异的假设。H1:备择假设(alternativehypothesis),或称研究假设、对立假设;是与零假设相对立的假设,即存在差异的假设。进行假设检验时,一般是从零假设出发,以样本与总体无差异的条件计算统计量的值,并分析计算结果在抽样分布上的概率,根据相应的概率判断应接受零假设、拒绝研究假设还是拒绝零假设、接受研究假设。2.小概率事件样本统计量的值在其抽样分布上出现的概率小于或等于事先规定的水平,这时就认为小概率事件发生了。把出现概率很小的随机事件称为小概率事件。当概率足够小时,可以作为从实际可能性上,把零假设加以否定的理由。因为根据这个原理认为:在随机抽样的条件下,一次实验竟然抽到与总体参数值有这么大差异的样本,可能性是极小的,实际中是罕见的,几乎是不可能的。3.显著性水平统计学中把拒绝零假设的概率称为显著性水平,用α表示。显著性水平也是进行统计推断时,可能犯错误的概率。常用的显著性水平有两个:α=0.05和α=0.01。在抽样分布曲线上,显著性水平既可以放在曲线的一端(单侧检验),也可以分在曲线的两端(双侧检验)。图9-1正态抽样分布上α=0.05的三种不同位置αα4.假设检验中的两类错误及其控制对于总体参数的假设检验,有可能犯两种类型的错误,即α错误和β错误。表9-1假设检验中的两类错误H0为真H0为假拒绝H0α错误正确接受H0正确β错误为了将两种错误同时控制在相对最小的程度,研究者往往通过选择适当的显著性水平而对α错误进行控制,如α=0.05或α=0.01。对β错误,则一方面使样本容量增大,另一方面采用合理的检验形式(即单侧检验或双侧检验)来使β误差得到控制。在确定检验形式时,凡是检验是否与假设的总体一致的假设检验,α被分散在概率分布曲线的两端,因此称为双侧检验。双侧检验的假设形式为:H0:μ=μ0,H1:μ≠μ0凡是检验大于或小于某一特定条件的假设检验,α是在概率分布曲线的一端,因此称为单侧检验。单侧检验的假设形式为:H0:μ≥μ0,H1:μ<μ0或者H0:μ≤μ0,H1:μ>μ05.假设检验的基本步骤一个完整的假设检验过程,一般经过四个主要步骤:⑴.提出假设⑵.选择检验统计量并计算统计量的值⑶.确定显著性水平⑷.做出统计结论t检验T检验是检验样本的均值和给定的均值是否存在显著性差异。T检验分为3类:一、样本平均数与总体平均数差异显著性检验二、非配对设计两样本均数差异显著性检验三、配对设计两样本均数差异显著性检验一、单样本T检验

1.单样本T检验的目的。单样本检验的目的是利用来自某总体的样本数据,推断该总体的均值是否与制定的检验值之间存在显著性差异。它是对总体均值的假设检验。单一样本的T检验概念:检验单个变量的均值是否与给定的常数(指定的检验值)之间是否存在显著差异。如:研究人员可能想知道一组学生的IQ平均分与100分的差异。要求样本来自正态分布总体。菜单:Analyze->CompareMeans->One-SamplesTtestTestVariable(s):要求平均值的变量(一般是定距变量)TestValue:常数零假设H0:样本均值Mean=常数(检验值);结果中比较有用的值:Mean和Sig显著性概率值例1

成虾的平均体重一般为21g。在配合饲料中添加0.5%的酵母培养物饲养成虾时,随机抽取16只对虾,体重为20.1、21.6、22.2、23.1、20.7、19.9、21.3、21.4、22.6、22.3、20.9、21.7、22.8、21.7、21.3、20.7。试检验添加0.5%的酵母培养物是否提高了成虾的体重。一、样本平均数与总体平均数差异显著性检验1、数据输入AnalyzeCompareMeanOneSamplesTTest2、统计分析样本数平均数标准差均数标准误差t值自由度P值(双侧概率)均数差值差值的95%置信区间独立样本的T检验要求:a.被比较的两组样本彼此独立,没有配对关系b.两组样本均来自正态总体

c.均值是对于检验有意义的描述统计量两组样本方差相等和不等时使用的计算t值的公式不同。因此应该先对方差进行齐次性检验。SPSS的输出,在给出方差齐和不齐两种计算结果的t值,和t检验的显著性概率的同时,还给出对方差齐次性检验的F值和F检验的显著性概率。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。进行方差齐次检验使用F检验。对应的零假设是:两组样本方差相等。概率p<0.05时,否定原假设,说明方差不齐;否则两组方差无显著性差异。F计算公式为:F=MAX(v1,v2)/MIN(v1,v2)(方差比)菜单:Analyze->CompareMeans->IndependentSamplesTtestTestVariable(s):要求平均值的变量(一般是定距或定序变量)GroupingVariable:分组变量(只能分成两组)结果中比较有用的值:方差齐次性检验F的Sig和方差相等或不相等的Sig(Sig为显著性概率值)Independent-Samples

TTest对话框分组变量输出结果:P值=0.144>0.10,应接受原假设,即可以认为该市男女青少年的身高不存在显著差异。配对样本的T检验用于检验两配对总体的均值是否具有显著性差异,其前提是两样本具有配对关系,且其来自的总体均服从正态分布;实质是检验每对测量值差值变量的均值与零之间差异的显著性,若差异不显著,则说明配对变量均值之间的差异不显著;可通过Paired-SamplesTTest对话框实现。例4.2d10个高血压患者在施以体育疗法前后测定舒张压,要求判断体育疗法对降低血压是否有效,数据编号data06-04。

患者编号疗法前疗法后1 2 3 4 5 6 7 8 9 10 112113134 110 125 117 108 120 118 138 10496103901081199290102121配对样本t检验实例Paired-Samples

TTest对话框指定配对变量输出结果:P值=0.000<0.05,应拒绝原假设,表明体育疗法对降低血压有效。二、非配对设计两样本均数差异显著性检验AnalyzeCompareMeanIndependedSamplesTTest例2

有人配制两种不同饵料A、B养殖罗非鱼,选取14个鱼池,随机均匀分两组进行试验。经一定实验期后称取产鱼量。试问这两种不同饵料养殖罗非鱼的产鱼量又无差异?F值P值t值自由度P值(双侧)均数差值差值的标准误假设方差齐性假设方差不齐方差齐性检验三、配对设计两样本均数差异显著性检验1、自身配对2、同源配对例310只家兔接种某种疫苗前后体温发生变化。试检验接种前后提问是否有显著变化?AnalyzeCompareMeanPairedSamplesTTest相关关系分析无线性相关两变量之差的均数一.方差分析的基本原理方差分析又称为变异分析(analysisofvariance,ANOVA),是由斯内德克(GeorgeWaddelSnedecor)提出的一种方法。方差分析通过对多组平均数的差异进行显著性检验,分析实验数据中不同来源的变异对总变异影响的大小。1.方差分析的逻辑方差分析作为一种统计方法,是把实验数据的总变异分解为若干个不同来源的分量。因而它所依据的基本原理是变异的可加性。在统计分析中,一般用方差来描述变量的变异性。方差分析是将总平方和分解为几个不同来源的平方和(实验数据与平均数离差的平方和)。然后分别计算不同来源的方差,并计算方差的比值即F值。根据F值是否显著对几组数据的差异是否显著作出判断。例假定从小学一、三、五年级中,随机各抽取了4个学生,向他们呈现一组词汇,然后将他们识记词汇的分数绘成图。其结果可能会是不同的情形。图13-1不同年级学生识记词汇的得分一年级三年级五年级图13-2不同年级学生识记词汇的得分一年级三年级五年级2.方差分析的基本过程⑴.提出假设⑵.选择检验统计量并计算①.分解平方和SS②.分解自由度df③.计算方差MS④.计算F值⑶.作出统计结论并列方差分析表3.方差分析的基本条件⑴.总体正态分布⑵.各实验处理是随机的且相互独立(一般情况下都能满足)⑶.各实验处理内方差一致(需要进行检验)4.方差分析中的几个概念实验中的自变量称为因素。只有一个自变量的实验称为单因素实验,两个或两个以上称为多因素实验。某一因素的不同情况称为因素的“水平”。水平包括量差或质别两类情况,按各个“水平”条件进行的重复实验称为各种实验处理。5.方差分析中的方差齐性检验方差分析中的方差齐性检验,常用哈特莱(Hartley)所提出的最大F值检验法,其计算公式为(13.1)各组容量不等时,用最大的n计算自由度:表13-1Fmax检验统计决断规则Fmax与临界值比较P值显著性检验结果Fmax<Fmax(df)0.05P>0.05不显著保留H0,拒绝H1Fmax(df)0.05≤Fmax<Fmax(df)0.010.05≥P>0.01显著*在0.05显著性水平拒绝H0,接受H1Fmax≥Fmax(df)0.01P≤0.01极其显著**在0.01显著性水平拒绝H0,接受H1SPSS中实现过程分析——比较均值——单因素ANOVASPSS中实现过程

研究问题三组学生的数学成绩人名数学组别hxh99.000yaju88.000yu99.000shizg89.000hah94.000s90.000watet79.002jess56.002wish89.0022_new199.0022_new270.0022_new389.0022_new455.0012_new550.0012_new667.0012_new767.0012_new856.0012_new956.001

实现步骤在菜单中选择“One-WayANOVA”命令“One-WayANOVA”对话框“One-WayANOVA:Options”对话框“One-WayANOVA:Contrasts”对话框“One-WayANOVA:PostHocMultipleComparisons”对话框结果和讨论

(1)首先是单因素方差分析的前提检验结果,也就是Homogeneityofvariancetest——方差齐次性检验(2)输出的结果文件中第2个表格如下所示。(3)输出的结果文件中第3个表格如下所示。(4)输出的结果文件中第4个表格如下所示。

(5)输出结果的最后部分是各组观察变量均值的折线图,如图5-6所示。事后比较方法的选择LSD法实际上是t检验的变形,只是在变异和自由度的计算上利用了整个样本信息,而不仅仅是所比较两组的信息。因此它敏感度是最高,在比较时仍然存在放大α水准(一类错误)问题,但换言之就是总的二类错误非常的小,要是LSD都没有检验出差别,那恐怕真的没有差别。SNK法运用的最广泛的,它采用StudentRange分布进行所有各组均值间的配对比较。该方法保证在H0真正成立时总的α水准等于实际设定值,即控制了一类错误。张文彤P268二.完全随机设计的方差分析方差分析处理的一般是由多个实验组接受一个变量或多个变量的多种水平的实验结果,是一种多组实验设计(本讲只介绍一个变量(即单因素)的方差分析)。这种多组实验设计的类型常用的有组间设计、组内设计和混合设计等等。完全随机设计(completerandomalizeddesign)的方差分析,是单因素组间设计的方差分析(one-waybetween-subjectsanalysisofvaricace)。为了检验某一个因素多种不同水平间差异的显著性,将从同一个总体中随机抽取的被试,再随机地分入各实验组,施以各种不同的实验处理之后,用方差分析法对这多个独立样本平均数差异的显著性进行检验,称为完全随机设计的方差分析。完全随机设计的方差分析中,把各种变异的总和称为总变异,并把总变异分成两部分:一部分称为组间变异,是在不同实验组之间表现出来的差异;另一部分称为组内变异,是在同一实验组内部不同被试之间表现出来的差异。

在实验的结果中,如果组内的差异较大,而组间的差异较小,表明几种不同的实验处理在效果上并没有明显的差别。如果组间的差异较大,而组内的差异较小则说明几种不同的实验处理在效果上表现出明显的差别。1.变异来源完全随机设计的方差分析将变异来源分解为组间变异和组内变异两部分。组间变异是不同实验组分数之间的变异。组内变异是实验组内部各分数之间的变异。2.完全随机设计方差分析的计算公式⑴.分解平方和总平方和可以分解为组间平方和与组内平方和(13.2)各平方和的计算公式:组间平方和组内平方和总平方和(13.3)(13.4)(13.5)⑵.分解自由度组间自由度组内自由度总自由度(13.7)(13.8)(13.9)总自由度可以分解为组间自由度和组内自由度:(13.6)⑶.计算方差组间方差

组内方差⑷.计算F值

(13.10)(13.11)(13.12)表13-2F检验统计决断规则F与临界值比较P值显著性检验结果F<F(dfB,dfW)0.05P>0.05不显著保留H0,拒绝H1F(dfB,dfW)0.05≤F<

F(dfB,dfW)0.010.05≥P>0.01显著*在0.05显著性水平拒绝H0,接受H1F≥F(dfB,dfW)0.01P≤0.01极其显著**在0.01显著性水平拒绝H0,接受H1⑸.做出统计决断⑹.列出完全随机设计的方差分析表变异来源平方和自由度方差F值概率组间变异SSBdfBM

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论