均数差异显著性检验EXCEL_第1页
均数差异显著性检验EXCEL_第2页
均数差异显著性检验EXCEL_第3页
均数差异显著性检验EXCEL_第4页
均数差异显著性检验EXCEL_第5页
已阅读5页,还剩66页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

会计学1均数差异显著性检验EXCEL目的要求显著性检验的目的、方法以及步骤Excel进行t检验的步骤、方法第1页/共71页第一节概率及分布概述第2页/共71页一、事件定义:在一定条件下,某种事物出现与否就称为是事件。自然界和社会生活上发生的现象是各种各样的,常见的有两类。第3页/共71页在一定条件下必然出现某种结果或必然不出现某种结果。确定性事件必然事件(U)(certainevent)不可能事件(V)(impossibleevent)一、概率基本概念第4页/共71页在一定条件下可能发生也可能不发生。随机事件(randomevent)不确定事件(indefiniteevent)

为了研究随机现象,需要进行大量重复的调查、实验、测试等,这些统称为试验。第5页/共71页二、频率(frequency)若在相同的条件下,进行了n次试验,在这n次试验中,事件A出现的次数m称为事件A出现的频数,比值m/n称为事件A出现的频率(frequency),记为W(A)=m/n。0≤W(A)≤1第6页/共71页抛掷一枚硬币发生正面朝上的试验记录

从表中可以看出,试验随着n值的不同,正面朝上出现的频率也不相同,当n越大时,频率越接近0.50。实验者投掷次数(n)发生正面朝上次数(m)频率(m/n)蒲峰404020480.5069皮尔逊1200060190.5016皮尔逊24000120120.5005第7页/共71页一、概率基本概念

频率表明了事件频繁出现的程度,因而其稳定性说明了随机事件发生的可能性大小,是其本身固有的客观属性,提示了隐藏在随机现象中的规律性。概率第8页/共71页

定义:设在相同的条件下,进行大量重复试验,若事件A的频率稳定地在某一确定值p的附近摆动,则称p为事件A出现的概率。P(A)=p第9页/共71页统计概率

抛掷一枚硬币发生正面朝上的试验记录实验者投掷次数发生正面朝上的次数频率(m/n)

蒲丰404020480.5069K皮尔逊1200060190.5016K皮尔逊24000120120.5005随着实验次数的增多,正面朝上这个事件发生的频率稳定接近0.5,我们称0.5作为这个事件的概率。第10页/共71页三、概率(probability,P)P(A)=p=lim

在一般情况下,随机事件的概率P是不可能准确得到的。通常以试验次数n充分大,随机事件A的频率作为该随机事件概率的近似值。mnmn第11页/共71页12345678910随机抽取一个球,求下列事件的概率;(1)事件A=抽得一个编号<4(2)事件B=抽得一个编号是2的倍数该试验样本空间由10个等可能的基本事件构成,即n=10,而事件A所包含的基本事件有3个,即抽得编号为1、2、3中的任何一个,事件A便发生。P(A)=3/10=0.3P(B)=5/10=0.5第12页/共71页一、概率基本概念12345678910A=“一次取一个球,取得红球的概率”10个球中取一个球,其可能结果有10个基本事件(即每个球被取到的可能性是相等的),即n=10事件A:取得红球,则A事件包含3个基本事件,即m=3P(A)=3/10=0.3第13页/共71页四、小概率事件原理概念:如果某事件发生的概率很小,在大量重复试验中事件发生的频率也很小,在1次试验中该事件被看做是不会发生的。应用:是假设检验时进行统计推断的理论依据。通常将5%,1%认为是小概率的标准,又称显著水平。第14页/共71页第二节

均数差异显著性检验第15页/共71页一、复习回顾生物统计的本质:

研究如何从样本推断总体样本抽取的原则:随机抽样试验误差的概念:由样本推断总体时,由各种无法控制的随机因素引起的误差。第16页/共71页

现在,我们假设有这样一个情况:从一批同质(相同品种、相同日龄、相同饲料、相同饲养管理等)的20000只肉鸡中随机抽取各含100只肉鸡的两个样本,分别称量其42天出栏重,结果发现:

样本1平均出栏重为:2.24kg/只样本2平均出栏重为:2.31kg/只?

两样本来自同一总体,但二者的样本平均数却存在一定差异第17页/共71页这种差异来源于随机抽样

造成的随机误差!第18页/共71页

现在,我们再来看另一种情况:在相同日龄、相同饲料、相同饲养管理等条件下,随机从两个品种(AA肉鸡、艾维因肉鸡)的各10000只肉鸡中分别抽取100只肉鸡做为样本,称量其42天出栏重,结果发现:

AA肉鸡平均出栏重为:2.31kg/只艾维因肉鸡平均出栏重为:2.24kg/只

差异

品种本质差异

随机误差?第19页/共71页

在试验进行过程中,尽管尽量排除随机误差的影响,以突出试验的处理效应,但由于生物个体间无法避免的差异,以及诸多无法控制的随机因素,使得试验结果最后表现的观察值除了处理效应以外,还包括试验误差的效应。处理效应误差效应表面效应第20页/共71页

二、显著性检验的目的

对两个样本进行比较时,必须判断样本间差异主要是随机误差造成的,还是本质不同或处理效应引起的?处理效应误差效应表面效应处理效应误差效应

显著性检验

显著性检验第21页/共71页分析误差产生的原因确定差异的性质排除误差干扰对总体特征做出正确判断三、显著性检验的任务第22页/共71页四、显著性检验的原理小概率原理:统计假设:对总体的某些未知或不完全知道的性质提出待考查的命题,通常包括无效假设和备择假设。根据样本资料对假设的成立与否进行推断就是假设检验,也称显著性检验。第23页/共71页五、显著性检验的分类

t检验——主要用于检验两个处理平均数差异是否显著;

方差分析——主要用于检验多个处理平均数间差异是否显著;

检验

——

主要用于由质量性状得来的次数资料的显著性检验等。

第24页/共71页六、显著性检验的步骤1、提出假设2、确定显著水平3、选定检验方法,计算检验统计量,确定概率值作出推断4、结论:是否接受假设第25页/共71页例1:随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数,得到如下数据资料:试比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。产仔数内江猪141512111317141413荣昌猪121413131214101010下面以两均数差异显著性检验为例具体说明操作步骤。第26页/共71页1、提出假设对立无效假设/零假设/检验假设备择假设/对应假设1

=2

1

2误差效应处理效应H0HA第27页/共71页

提出假设:

(1)无效假设H0:1

=2

即假设两品种经产母猪产仔数的总体平均数相等,试验的处理效应(品种间差异)为0。(2)备择假设HA

1≠2

即假设两品种经产母猪产仔数的总体平均数1

和2

不相等,亦即存在处理效应,其意义是指两品种经产母猪产仔数存在本质上的差异。例:比较内江猪与荣昌猪两品种经产母猪产仔数是否存在显著差异。第28页/共71页2、确定显著水平=0.05显著水平*极显著水平**能否定H0的人为规定的概率标准称为显著水平,记作。

统计学中,一般认为概率小于0.05或0.01的事件为小概率事件,所以在小概率原理基础上建立的假设检验也常取=0.05和=0.01两个显著水平。P<=0.01=0.05第29页/共71页3、选定检验方法,计算检验统计量,确定概率值

根据研究设计的类型和统计推断的目的选择使用不同的检验方法。例:

这里是对两品种经产母猪产仔数的总体平均数进行比较,因此为均数差异显著性检验------t检验。第30页/共71页在无效假设H0成立的前提下计算t值注:由于计算过程复杂,这里不再重复书上内容,在下面将具体讲解如何用Excel来进行统计分析。第31页/共71页Excel进行t检验分类Excel可提供的t检验工具:t-检验:双样本等方差假设

此t-检验先假设两个数据集取自具有相同方差的分布,可确定两个样本是否来自具有相同总体平均值的分布。t-检验:双样本异方差假设

此t-检验先假设两个数据集取自具有不同方差的分布,可以确定两个样本是否来自具有相同总体平均值的分布。当两个样本中有截然不同的对象时,可使用此检验。t-检验:平均值的成对二样本分析

当样本中存在自然配对的观察值时(例如,对一个样本组在实验前后进行了两次检验),可以使用此成对检验,以确定取自处理前后的观察值是否来自具有相同总体平均值的分布。第32页/共71页Excel进行t检验步骤(一)输入数据第33页/共71页Excel进行t检验步骤(二)“工具”

“数据分析”

“t检验”

这里假设无效假设Ho成立,即两品种无差异,二者来自同一总体,则为“双样本等方差假设”。第34页/共71页Excel进行t检验步骤(三)

拉取两品种数据

假设Ho成立,则平均差为0.“内江猪”“荣昌猪”做为标志拉取在上面的变量区域中

显著水平

结果输出区域,可选任一空白单元格第35页/共71页Excel进行t检验步骤(四)

双尾概率P

计算所得t值第36页/共71页4、作出推断结论:是否接受假设P>P<小概率原理接受H0否定HA否定H0接受HA假设H0成立可能正确假设H0成立可能错误第37页/共71页例:上例中

P=0.053>0.05所以接受H0,从而得出结论:内江猪与荣昌猪经产母猪产仔数未发现有显著差异,其表面差异应有大于5%的概率归于随机误差所致。第38页/共71页分析题意提出假设确定显著水平计算检验统计量作出推断

假设检验的步骤:第39页/共71页显著性检验的两类错误

H0正确

H0错误否定H0

错误()

推断正确(1-)接受H0

推断正确(1-)

错误()第一类错误(typeIerror),又称弃真错误或错误;第二类错误(typeII

error

),又称纳伪错误或错误七、显著性检验两种类型错误第40页/共71页1、两类错误既有联系又有区别

错误只在否定H0时发生

错误只在接受H0时发生错误增加错误减小错误增加错误减小第41页/共71页2、还依赖于-0的距离3、n,

2可使两类错误的概率都减小.第42页/共71页八、样本均数与总体均数差异显著性检验第43页/共71页无效假设为Ho:o备择假设为HA:o计算公式如下:根据以上公式可导出以下结论:

由此可知,当总体平均数落在已知的样本均数置信概率为(1-)的置信区间以外时,就表明在显著水平时差异显著。样本均数与总体均数差异显著性检验t检验第44页/共71页

例5.2:母猪的怀孕期为114d,现抽测12头大白猪母猪的怀孕期分别为115,113,114,112,116,115,114,118,113、115、114、113,试检验所得样本的平均数与总体平均数114d有无显著差异?第一步,输入数据第45页/共71页

第二步,工具---数据分析---描述统计第46页/共71页

第三步,输入参数第47页/共71页第四步,计算结果95%置信区间下限:114.3333-1.025696=113.3上限:114.3333+1.025696=115.4总体平均数:114d

分析:总体平均数落在样本均数置信概率为95%的置信区间内(113.3~115.4),说明样本均数与总体均数差异不显著。第48页/共71页九、两个样本平均数的差异显著性检验成组数据平均数的比较成对数据平均数的比较试验设计非配对试验设计配对试验设计第49页/共71页非配对试验—成组数据平均数的比较

试验单位完全随机地分两组,各实施一试验处理,两个样本之间的变量没有任何关联,不论两样本的容量是否相同,所得数据皆为成组数据。两组数据以组平均数作为相互比较的标准,来检验其差异的显著性。

如:随机抽测9头内江猪和9头荣昌猪经产母猪的产仔数:内江猪:14,15,12,11,13,17,14,14,13

荣昌猪:12,14,13,13,12,14,10,10,20

分析:这里两品种猪的产仔数无任何关联,每种猪的产仔数分别组成一组数据,相互比较时以组平均数做为比较标准,在Excel里进行t检验时应采用“t检验-双样本等方差假设”或“t检验-双样本异方差假设”进行分析。第50页/共71页配对试验—成对数据平均数的比较

试验单位两两配对,随机分配到两个处理,配对的试验单位要求存在相似性,而每个处理内的各试验单位不一定相似,可以变异较大,但配对内试验单位要求相似,因此,两样本容量相同,所得数据为成对数据,两组数据以相配对的试验单位之间的差异作为相互比较的标准,来检验其差异的显著性。在Excel里进行t检验时应采用“t检验-平均值的成对二样本分析”模块进行分析。第51页/共71页配对试验—成对数据平均数的比较

如:从8窝仔猪中每窝选出性别相同、体重相近的两头随机分配到两个饲料组中进行对比试验:12345678甲x110.011.214.012.17.59.816.510.8乙x29.810.613.311.56.69.015.89.8x1-

x20.20.60.70.60.90.80.71.0窝号饲料

分析:每窝中选出的性别相同,体重相近的两头仔猪做为一个配对被随机分到甲、乙两组饲喂两种饲料,但甲组中来自8窝的仔猪之间可以性别不同,体重不相近,因此最后的数据是原来属于同一窝的两仔猪的成对数据,比较的是配对仔猪之间的差异,而非两组平均数的差异。第52页/共71页实例:某研究所对三黄肉鸡进行饲养对比试验,试验时间为60d,增重结果如下表,问甲乙两种饲料对三黄鸡的增重效果有无显著影响?非配对试验—成组数据平均数的比较第53页/共71页(1)假设(2)水平(3)检验H0:μ1=μ2,即认为两种饲料增重效果相同。HA:μ1≠μ2,即认为两种饲料增重效果不同。选取显著水平α=0.05第一步,在Excel中输入数据第54页/共71页第二步,工具—数据分析—t检验-双样本等方差假设第55页/共71页(4)推断P=0.21>0.05,故接受H0,否定HA;认为两种饲料饲喂三黄鸡的增重效果差异不显著。第三步,得出检验结果第56页/共71页配对试验—成对数据平均数的比较实例1:现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间为30d,结果见下表,问两种品牌饲料饲喂仔猪增重有无显著差异?12345678甲x110.011.211.012.110.59.811.510.8乙x29.810.69.010.59.69.010.89.8x1-

x20.20.62.01.60.90.80.71.0窝号饲料第57页/共71页(1)假设(2)水平(3)检验H0:μ1=μ2,即认为两种饲料增重效果相同。HA:μ1≠μ2,即认为两种饲料增重效果不同。选取显著水平α=0.05第一步,在Excel中输入数据第58页/共71页第二步,工具—数据分析—t检验-平均值的成对二样本分析第59页/共71页(4)推断P=0.0019<0.05,故否定H0,接受HA;认为两种饲料饲喂仔猪的增重效果差异显著。第三步,得出检验结果第60页/共71页实例2:现用国产与进口的背膘厚测定仪,对14头肥猪进行了测定(单位:mm),数据如下:试检验两种仪器测定的结果有无显著差异?分析:这里是用国产和进口两种仪器测得同一头猪的背膘厚数据分到两组,是同一样本前后两次试验的结果,属配对试验设计。第61页/共71页(1)假设(2)水平(3)检验H0:μ1=μ2,即认为两种仪器结果相同。HA:μ1≠μ2,即认为两种仪器结果不同。选取显著水平α=0.05第一步,在Excel中输入数据第62页/共71页第二步,工具—数据分析—t检验-平均值的成对二样本分析第63页/共71页(4)推断P=0.92>0.05,故接受H0,否定HA;认为两种仪器测定背膘厚的结果差异不显著。第三步,得出检验结果第64页/共71页十、百分数资料的差异显著性检验样本百分数与总体百分数差异显著性检验两个样本百分数差异显著性检验第65页/共71页基本步骤:

1.提出无效假设与备择假设无效假设H0:p=p0

备择假设HA:p≠p02.计算t值

3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断若<1.96,则p>0.05,表明p与p0差异不显著;若1.96≤<2.58,则0.01<p≤0.05,表明p与p0差异显著;若≥2.58,则p≤0.01,表明p与p0差异极显著;(一)样本百分数与总体百分数差异显著性检验第66页/共71页实例:据往年调查,某地区的雏鸡白痢病的发病率一般为

30%,现对某鸡场500只雏鸡进行检测,结果有175只凝集反应呈阳性,问该鸡场的白痢病是否比往年严重?

分析:此例总体百分数p0=30%

样本百分数p=175/500=35%

1.提出无效假设与备择假设无效假设H0:p=p0

备择假设HA:p≠p02.计算t值

==0.0205

于是=(0.35-0.30)/0.0205=2.439

3.将计算所得的t的绝对值与1.96,2.58比较,作出统计推断因为1.96≤2.44<2.58,则0.01<p≤0.05,表明p=35%与p0=30%差异显著,故该鸡场的雏鸡白痢病比往年严重。第67页/共71页(二)两个样本百分数差异显著性检验基本步骤:

1.提出无效假设与备择假设无效假设H0:p1=p2

备择假设HA:p1≠p22.计算t值

3.将

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论