第三章差异显著性测验学生复习用_第1页
第三章差异显著性测验学生复习用_第2页
第三章差异显著性测验学生复习用_第3页
第三章差异显著性测验学生复习用_第4页
第三章差异显著性测验学生复习用_第5页
已阅读5页,还剩196页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第三章第三章差异显著性测验差异显著性测验 学习本章需掌握的知识要点学习本章需掌握的知识要点1、基本概念、基本概念2、正态分布概率的计算方法、正态分布概率的计算方法3、理解平均数间的比较用差异显著、理解平均数间的比较用差异显著性测验的理由,减少试验误差的措施性测验的理由,减少试验误差的措施4、差异显著性测验的原理、方法及、差异显著性测验的原理、方法及其应用其应用5、熟记差异显著、熟记差异显著性测验的计算公式性测验的计算公式 主要内容主要内容 一、一、统计假设检验统计假设检验概念与统计理论概念与统计理论 二、差异显著性测验二、差异显著性测验(一)统计假设检验的原理和方法(一)统计假设检验的原理和方

2、法(二)单个平均数的假设检验(二)单个平均数的假设检验(三)两个平均数相比较的假设检验(三)两个平均数相比较的假设检验(四)百分数的假设检验(四)百分数的假设检验(五)参数的区间估计(五)参数的区间估计3.1 基本概念基本概念n一、概念一、概念l一般人比较两种事物在数量性状方面一般人比较两种事物在数量性状方面的差异(如比较两个品种的产量,或的差异(如比较两个品种的产量,或比较两种农药对某种病虫的防治效果比较两种农药对某种病虫的防治效果等等),习惯用平均数作为比较标准,等等),习惯用平均数作为比较标准,求一个平均数的差数便算完事。求一个平均数的差数便算完事。3.1 基本概念基本概念n例如,例如,

3、 有有a、b两种农药杀虫两种农药杀虫试验,两种试验,两种农药杀虫效果如下:农药杀虫效果如下: x1 (a)8.29.68.78.99.48.5=53.3 =8.88x2 (b)10.711.29.210.911.110.8=63.9 =10.651x2x1x2x3.1 基本概念基本概念n统计学认为,这样得出的结论是不可靠的统计学认为,这样得出的结论是不可靠的 。因为如果我们再做一次因为如果我们再做一次ab两种农药杀虫试两种农药杀虫试验,又可得到验,又可得到两个样本资料两个样本资料 。由于抽样误。由于抽样误差的随机性,两样本平均数就不一定是差的随机性,两样本平均数就不一定是8.88和和10.65

4、,其差值也不一定是,其差值也不一定是1.77 。造成这。造成这种差异可能有两种原因:种差异可能有两种原因:l一是两种农药杀虫效果(处理效应)不一是两种农药杀虫效果(处理效应)不同造成的差异,即是两种农药本质不同同造成的差异,即是两种农药本质不同所致。所致。l另一可能是试验误差(或抽样误差)。另一可能是试验误差(或抽样误差)。试验获得的数据,受到试验获得的数据,受到2种效应的影响:种效应的影响:试验处理效应试验处理效应(treatment effects):由处:由处理因素影响观察值的大小;理因素影响观察值的大小;试验误差效应试验误差效应(error effects):除了试验:除了试验处理效应

5、外,其他因素造成观察值的大小处理效应外,其他因素造成观察值的大小差异。差异。试验结果取得的数据,计算出的平均数试验结果取得的数据,计算出的平均数 , 也有以下的不足之处:也有以下的不足之处: 与与有一定的差异;有一定的差异; 是观察值的统计值,受处理效应和误是观察值的统计值,受处理效应和误差效应的影响。差效应的影响。xxx3.1 基本概念基本概念n1、试验误差(、试验误差(error)l除了试验处理效应外,其他因素造除了试验处理效应外,其他因素造成观察值的差异称为试验误差。成观察值的差异称为试验误差。n2、误差的类型、误差的类型l(1)系统误差:由于试验条件不同造成)系统误差:由于试验条件不同

6、造成的误差;的误差;l在整个试验过程中误差的符号和数值是在整个试验过程中误差的符号和数值是恒定不变的,或者遵循着一定规律变化,恒定不变的,或者遵循着一定规律变化,即始终向一个方向减小或增加。即始终向一个方向减小或增加。l其出现有规律,可以其出现有规律,可以校正和消除校正和消除。3.1 基本概念基本概念n(2)偶然误差偶然误差(随机误差随机误差):):严格控制试严格控制试验条件后,由于偶然性因素造成的误差。验条件后,由于偶然性因素造成的误差。n特点:特点:l有偶然性有偶然性:试验误差不可能避免,只能:试验误差不可能避免,只能减少,不能消除。减少,不能消除。l具有随机性具有随机性:服从一定的概率分

7、布,它:服从一定的概率分布,它发生的可能性大小是受其本身概率支配。发生的可能性大小是受其本身概率支配。l正态分布正态分布:可用正态分布规律估计试验:可用正态分布规律估计试验误差的大小,判断试验的可靠程度。误差的大小,判断试验的可靠程度。 3.1 基本概念基本概念n3、减少试验误差的方法、减少试验误差的方法n(1)合理的试验设计;)合理的试验设计;n(2)严格控制试验的条件,除了试验处理)严格控制试验的条件,除了试验处理的项目外,其他条件要尽可能做到一致。的项目外,其他条件要尽可能做到一致。n(3)试验要有一定的重复,要有对照;)试验要有一定的重复,要有对照;n(4)调查取样的方法要适当,取样要

8、随机,)调查取样的方法要适当,取样要随机,不能主观挑选,要有适当大小的样本容量。不能主观挑选,要有适当大小的样本容量。 如药剂防治试验,如药剂防治试验,除不同农药种类外,其他如:药剂浓度、用量、施用时期、施用方法、调查日期、防治对象作物的品种、栽培条件和生育阶段,防治对象害虫的密度、虫龄,或防治对象病害喷药前发生程度等等,都要求尽可能一致。 3.1 基本概念基本概念n对两个样本进行比较时对两个样本进行比较时 ,必须判断样,必须判断样本间差异是本间差异是抽样误差抽样误差造成的,还是造成的,还是本本质质不同引起的。如何区分两类性质的不同引起的。如何区分两类性质的差异?怎样通过样本来推断总体?这差异

9、?怎样通过样本来推断总体?这正是显著性检验要解决的问题。正是显著性检验要解决的问题。3.1 基本概念基本概念n4、差异显著性测验的概念、差异显著性测验的概念l也称统计检验,是检验和推断试验也称统计检验,是检验和推断试验因素是否存在真实效应的一种数学判断因素是否存在真实效应的一种数学判断方法。方法。 l对试验误差作出估计,看试验处理间的对试验误差作出估计,看试验处理间的差异或样本均数与总体均数的离差有没差异或样本均数与总体均数的离差有没有超出试验误差的范围的测验方法称为有超出试验误差的范围的测验方法称为差异显著性测验。差异显著性测验。3.1 基本概念基本概念l要估计试验误差,就要了解试验误差出要

10、估计试验误差,就要了解试验误差出现的规律性。要了解试验误差出现的规现的规律性。要了解试验误差出现的规律性,律性,就需了解理论分布的有关知识。就需了解理论分布的有关知识。l理论分布主要有二项分布、正态分布等。理论分布主要有二项分布、正态分布等。l重点了解正态分布重点了解正态分布l二项分布的极限就呈正态分布二项分布的极限就呈正态分布3.1 基本概念基本概念n(一)二项分布(一)二项分布n试验或调查中最常见的一类间断性随机变试验或调查中最常见的一类间断性随机变数,是整个总体的各个个体或单位可以根数,是整个总体的各个个体或单位可以根据某种性状的出现与否分为据某种性状的出现与否分为非此即彼非此即彼的两的

11、两种情况,这一类资料就叫种情况,这一类资料就叫“二项资料二项资料”。n例如种子的发芽或不发芽,施药后的害虫例如种子的发芽或不发芽,施药后的害虫死或活,植株的发病或不发病,杂交后代死或活,植株的发病或不发病,杂交后代分离抗病或感病等等。分离抗病或感病等等。这种非此即彼构成这种非此即彼构成的总体叫二项总体的总体叫二项总体(binomial distribution)。3.1 基本概念基本概念n二项分布的概率关系二项分布的概率关系l为了便于研究,通常给予此变量为为了便于研究,通常给予此变量为1,其概率为其概率为p;给予彼变量为;给予彼变量为0,其概,其概率为率为q,其概率关系为:,其概率关系为: l

12、 pq1l 或或 q1pn如果每次独立抽取如果每次独立抽取0,1总体的总体的n个个体个个体则所得变量则所得变量x将有将有0、1、n,共,共n+1种。这种。这n+1变量有它各自的概率而组成变量有它各自的概率而组成一个分布,这种分布叫二项概率分布。一个分布,这种分布叫二项概率分布。 3.1 基本概念基本概念n例如,观察施用某种农药后菜青虫的死亡例如,观察施用某种农药后菜青虫的死亡数记数记“死死”为为1,“活活”为为0,如每次取,如每次取5条条虫为一样本(虫为一样本(n=5),则有),则有6种(种(n+1种)可种)可能:能:l5条全活(条全活(0););一条死(一条死(1););l2条死(条死(2)

13、;); 3条死(条死(3););l4条死(条死(4);); 5条全死(条全死(5)。)。l由这由这6种可能相应概率组成的分布,就是种可能相应概率组成的分布,就是n=5时活虫数的二项分布。时活虫数的二项分布。3.1 基本概念基本概念n二项分布是间断性变数的一种最重要的二项分布是间断性变数的一种最重要的理论分布,它的应用范围是相当广泛的。理论分布,它的应用范围是相当广泛的。l1、二项分布的概率计算参见、二项分布的概率计算参见p28-29页,自学。页,自学。l2、二项总体的平均数和标准差、二项总体的平均数和标准差3.1 基本概念基本概念n对于一个给定的二项分布,对于一个给定的二项分布,n和和p是常数

14、,是常数,是两个重要的参数。是两个重要的参数。n随机变数二项分布总体的平均数和标准差随机变数二项分布总体的平均数和标准差可由下式求得:可由下式求得:(1)以个数为单位)以个数为单位 (2)以百分数为单位)以百分数为单位npqnppqp3.1 基本概念基本概念n3、二项分布的形状特点二项分布的形状特点n二项分布的形状决定于二项分布的形状决定于n和和p的大小。的大小。 n一定,图一定,图形随形随p变化而变化,如变化而变化,如p=q,二项分布呈对称分,二项分布呈对称分布;如布;如pq 为偏斜分布为偏斜分布, p与与q 相差越大,偏斜相差越大,偏斜越大。越大。3.1 基本概念基本概念 p一定,图形随一

15、定,图形随n而变化,而变化,n大,图形大,图形顶点向中间移;顶点向中间移;n小,小,图形偏度大。图形偏度大。n,不论不论p为何值,图形为何值,图形都对称。都对称。 当当n,p不过小,且不过小,且np、nq5,且数值,且数值接近时,二项分布接近时,二项分布正态分布。正态分布。 3.1 基本概念基本概念n即如果即如果n适当增大(大于适当增大(大于30)而)而p又不过又不过小(不靠近小(不靠近0值)并且值)并且np及及nq均不小于均不小于5,则此二项分布趋于正态分布,它的概率则此二项分布趋于正态分布,它的概率分布可以用正态离差概率表进行计算,分布可以用正态离差概率表进行计算,即是说,在此情况下,可将

16、间断性的二即是说,在此情况下,可将间断性的二项分布看作是连续性的正态分布。项分布看作是连续性的正态分布。 3.1 基本概念基本概念n(二)正态分布(二)正态分布(normal distribution)l1、概念、概念l正态分布正态分布是连续性变数的一种重要是连续性变数的一种重要的理论分布。它的分布曲线是对称的,的理论分布。它的分布曲线是对称的,一般叫正态分布曲线,或正态概率分布一般叫正态分布曲线,或正态概率分布曲线。曲线。l是指是指随机抽取变数,其总体的理论分布随机抽取变数,其总体的理论分布是以概率来表示的,而这种反映概率分是以概率来表示的,而这种反映概率分布的曲线就叫正态概率分布曲线。布的

17、曲线就叫正态概率分布曲线。3.1 基本概念基本概念n正态分布是一种在统计意义上和应用上正态分布是一种在统计意义上和应用上最重要的分布,是数量分布的基本类型。最重要的分布,是数量分布的基本类型。在生物和农业的科学试验中,绝大多数在生物和农业的科学试验中,绝大多数数量性状数据是属于正态分布的,试验数量性状数据是属于正态分布的,试验误差的分布服从于这种分布,许多统计误差的分布服从于这种分布,许多统计分析方法都是以正态分布为基础的。分析方法都是以正态分布为基础的。 而而且且在一定条件下,它还可以代替二项分在一定条件下,它还可以代替二项分布和其他间断性分布。布和其他间断性分布。3.1 基本概念基本概念n

18、100个小区玉米螟虫害株数分布属间断性分布,个小区玉米螟虫害株数分布属间断性分布,有有100个样本,开始是呈频数分布,频数分布图个样本,开始是呈频数分布,频数分布图是方柱形图,连成曲线是不光滑不对称的,如果是方柱形图,连成曲线是不光滑不对称的,如果采样无限增多,采样无限增多,n,柱形图就一一变为纵轴线,柱形图就一一变为纵轴线,连接的多边形图就成为一条对称的光滑曲线连接的多边形图就成为一条对称的光滑曲线3.1 基本概念基本概念n2、正态分布的特点、正态分布的特点n(1)正态分布曲线是一条光滑、钟形、顶)正态分布曲线是一条光滑、钟形、顶部平缓,两边对称而急剧下降,并向两端部平缓,两边对称而急剧下降

19、,并向两端延伸,但永远不与横轴相交的曲线,延伸,但永远不与横轴相交的曲线,曲线曲线的全距从的全距从到到+。见见p31页页图图31 正态分布曲线图正态分布曲线图 3 2 1 +1 +2 +3 +68.295.46 98.6 3.1 基本概念基本概念n(2)正态分布曲线围绕算术平均数向左)正态分布曲线围绕算术平均数向左右两侧作对称分布,所以它是一条对称右两侧作对称分布,所以它是一条对称曲线。正态分布的算术平均数、中数及曲线。正态分布的算术平均数、中数及众数相等,三者合一,都位于众数相等,三者合一,都位于 点。点。n(3)正态分布的多数观察值集中于算术)正态分布的多数观察值集中于算术平均数平均数 的

20、附近,离平均数愈远,相应的的附近,离平均数愈远,相应的次数愈少,在次数愈少,在 - 3 以外,次数极少。以外,次数极少。3.1 基本概念基本概念(4)正态分布曲线与)正态分布曲线与x轴之间所夹的总面轴之间所夹的总面积等于积等于1,因此在曲线下,因此在曲线下x轴的任何定值,轴的任何定值,例如从例如从 x=x1到到x=x2 之间的面积,等于之间的面积,等于 介乎这两个定值间介乎这两个定值间 面积占总面积的成面积占总面积的成 数,或者说等于数,或者说等于x落落 于这个区间内的概率。于这个区间内的概率。3.1 基本概念基本概念n(5)正态分布曲线的形状完全取决于正态分布曲线的形状完全取决于 和和 两个

21、参数,所以它是一个曲线系统。两个参数,所以它是一个曲线系统。 确定正态分布在确定正态分布在 x 轴上的中心位置,轴上的中心位置, 确确定正态分布的变异度。定正态分布的变异度。标准差相同标准差相同(=1)而平均数不同而平均数不同1=0,2=1,3=2三个正态曲线三个正态曲线平均数相同平均数相同(=0)而标准差不同而标准差不同的三个正态曲线的三个正态曲线3.1 基本概念基本概念n(6)正态分布曲线的方程式为:)正态分布曲线的方程式为:n表示平均数为表示平均数为 ,2为方差的正态分布记为方差的正态分布记作作 它它是一个曲线系统,是一个曲线系统,不同的总不同的总体有不同的体有不同的和和,正态曲线的位置

22、及形,正态曲线的位置及形态随态随和和的不同而不同,这就给研究具的不同而不同,这就给研究具体的正态总体带来困难体的正态总体带来困难 。为了一般化的。为了一般化的应用应用(简化计算简化计算),需将正态分布标准化。,需将正态分布标准化。) 13(21)(2)(21xneyxf),(2n概概率率密密度度函函数数3.1 基本概念基本概念n正态分布标准化,一般用一个新变数正态正态分布标准化,一般用一个新变数正态离差离差u来代替来代替x变数,即将变数,即将x离其平均数的离其平均数的差数,以差数,以为单位进行转换,于是为单位进行转换,于是u称标准正态离差称标准正态离差n令令=0,=1,可将(,可将(31)式标

23、准化为:)式标准化为:xu)23(21)(221ueu标准化正态分标准化正态分布密度函数布密度函数(u) 称为标准化正态分布密度函数,称为标准化正态分布密度函数,即即 =0, =1时的正态分布记作时的正态分布记作n(0,1),概率的取值范围是,概率的取值范围是01由于它有最简单的形式,各种不同由于它有最简单的形式,各种不同平均数和标准差都可以经过适当转平均数和标准差都可以经过适当转换用标准化分布表示出来,所以用换用标准化分布表示出来,所以用它来计算正态分布曲线的概率。它来计算正态分布曲线的概率。 标准化正态分布函数:标准化正态分布函数:(u) 称为标准化正态分布密度函数,即称为标准化正态分布密

24、度函数,即 =0, =1时的正态分布记作时的正态分布记作n(0,1)由于它有最简单的形式,各种不同平均由于它有最简单的形式,各种不同平均数和标准差都可以经过适当转换用标准数和标准差都可以经过适当转换用标准化分布表示出来,所以用它来计算正态化分布表示出来,所以用它来计算正态分布曲线的概率。分布曲线的概率。22121)(ueu3.1 基本概念基本概念n3、正态分布曲线区间面积或概率计算、正态分布曲线区间面积或概率计算l前述标准化正态分布曲线下任何两个前述标准化正态分布曲线下任何两个x定值定值间的面积或概率,完全由曲线的平均数间的面积或概率,完全由曲线的平均数()和和标准差标准差()来确定。详细面积

25、见附表来确定。详细面积见附表1,但一,但一些常用的概率数值见些常用的概率数值见p32页。页。 区间区间 面积或概率面积或概率u1 0.6826u2 0.9545u3 0.9973u1.96 0.9500*u2.58 0.9900* 常用的概率数值常用的概率数值 3 2 1 +1 +2 +3 +68.2695.45 99.73 3.1 基本概念基本概念根据正态分布的性质,变量在两个定值间根据正态分布的性质,变量在两个定值间取值的概率等于曲线与其取值的概率等于曲线与其x轴在该区间围轴在该区间围成的面积。成的面积。 因此概率的计算即正态分布概率密度函因此概率的计算即正态分布概率密度函数的定积分计算。

26、数的定积分计算。3.1 基本概念基本概念n一定区间概率的表示方法,一般采用下一定区间概率的表示方法,一般采用下述符号,若一随机变数述符号,若一随机变数x取取a与与b两个定两个定值,值,而而ab的概率,则此的概率,则此a、b两定值区两定值区间的概率(间的概率(p)表示方法为)表示方法为p (axb)p (axb)3.1 基本概念基本概念n在正态分布曲线下,在正态分布曲线下, x的两个定值从的两个定值从x=a 到到x =b的概率可用曲线下区间面积来表示,的概率可用曲线下区间面积来表示,下图所示面积。下图所示面积。a=面积面积 =p (axb)a b+a3.1 基本概念基本概念n因为正态分布曲线的全

27、距是从因为正态分布曲线的全距是从至至+,可以计算曲线下从可以计算曲线下从到到x的面积,其公的面积,其公式如下:式如下:l 称为正态分布的累积函数,称为正态分布的累积函数,f(x)称为概率密度函数。称为概率密度函数。xndxxfxf)43()()()(xfn3.1 基本概念基本概念n 称为正态分布的累积函数,现给予称为正态分布的累积函数,现给予变数变数x任何一定值任何一定值:n例如例如a, 则可以计算变数则可以计算变数xa的概率为的概率为 即即p(xa)= n如果给予定值如果给予定值b,计算,计算xb的概率为的概率为p(xb)= (35)n如果如果a与与b是变数是变数x的两个定值且的两个定值且a

28、b,则,则其区间概率可以从下式计算其区间概率可以从下式计算lp(axb)= - .(36))(xfn)(afn)(bfn)(afn)(bfn)(afn)(bfn采用这个方法计算区间概率有一个好处,就是事先可以制定一个标准化的累积正态分布fn(x) 表(如附表1),需要计算某一变数两个定值间的区间概率时,只要知道它的平均数和标准差,把这两个定值分别转换成正态离差( ),再从表上查出fn(x) 代入(36)式,就可以算出其间的概率,非常方便。xu3.1 基本概念基本概念n由于正态分布的由于正态分布的概率密度函数概率密度函数fn(x)是按是按x值将累值将累积积函数函数fn(x)求其导数得到,根据(求

29、其导数得到,根据(3-4)式)式n当当x=时,时,f()=0;当当x=+ ,f(+ )=1f(x)=0.5f(x)=1f(x)=0f(x) a b xa长度长度=p(axb)a 3.1 基本概念基本概念n【例【例31】 p33页。假定有一具有正态页。假定有一具有正态分布的随机变数分布的随机变数x,其平均数,其平均数=35,标,标准差准差=5,试计算,试计算x小于小于31和小于和小于45的的概率,介于概率,介于3145之间的概率,以及大之间的概率,以及大于于45的概率。的概率。3.1 基本概念基本概念n计算计算x31的概率:的概率:p(x31)= n先将先将x值值31转换成标准正态离差转换成标准

30、正态离差u值:值:n查附表查附表1,当当u=0.8时,累积正态分布,时,累积正态分布, =0.2119, 这说明从这说明从到到31范围内范围内的变值占全部变值的的变值占全部变值的21.19%,或者说就是,或者说就是变值小于变值小于31的概率的概率p(x31)=0.2119。)31(nf8 . 053531xu)31(nf(见图(见图3-3)3.1 基本概念基本概念nx45的概率:的概率:p(x45)= 查附表查附表1,当当u=2时,时, ,l即即x45的概率的概率p(x45)=0.9773。)45(nf253545xu9773. 0)45(nf(见图(见图3-3)3.1 基本概念基本概念n计算

31、计算x45的概率的概率n因为当因为当x=时,时, ,l故故p(x45)=1 p(x45) =10.9773=0.0227。nx 介于介于3145的区间的概率为:的区间的概率为: p(31x45)= p(x45)p(x31) =0.97730.2119=0.76541)(nf(见图(见图3-3)3.1 基本概念基本概念n(2)计算某个中间概率对应的)计算某个中间概率对应的 x 值值l例如,求中间概率为例如,求中间概率为0.99和和0.95的的x值值l已知:中间概率为已知:中间概率为0.99区间外的概率为区间外的概率为lp=1/2(10.99)=0.005,查附表,查附表1对应对应的的u=2.58

32、,即即p (x)=0.00494的的u= 2.58 l根据正态离差公式:根据正态离差公式:xu58. 2ux当当p=99时,时,3.1 基本概念基本概念l当概率为当概率为95 时时l中间概率为中间概率为0.95区间外的概率为区间外的概率为lp=1/2(10.95)=0.025,查附表,查附表1对应的对应的u=1.96,即取即取p (x)=0.0250的的u=1.96l根据正态离差公式:根据正态离差公式:xu96. 1ux当当p=95时,时, 3.1 基本概念基本概念二、差异显著性测验二、差异显著性测验3.2 差异显著性测验的原理差异显著性测验的原理n1、差异显著性测验的原理、差异显著性测验的原

33、理n“小概率事件实际不可能性小概率事件实际不可能性”原理是统计原理是统计学上进行假设检验(显著性检验)的基本学上进行假设检验(显著性检验)的基本依据。测验一个样本平均数的代表性大小,依据。测验一个样本平均数的代表性大小,就是看它在总体正态分布中出现的概率有就是看它在总体正态分布中出现的概率有多大,与总体均数是否有显著性差异。样多大,与总体均数是否有显著性差异。样本平均数离总体平均数愈远,出现的概率本平均数离总体平均数愈远,出现的概率就愈小。出现的概率很小就愈小。出现的概率很小(如小于如小于0.05或小或小于于0.01)的事件,在一次试验中很难碰上的,的事件,在一次试验中很难碰上的,可以看作是实

34、际上不可能出现的事件。可以看作是实际上不可能出现的事件。3.2 差异显著性测验的原理差异显著性测验的原理n如果样本均数出现的概率等于或小于如果样本均数出现的概率等于或小于5%,即样,即样本在本在95%范围外,范围外,100次抽样中有次抽样中有95次得不到此次得不到此样本,就认为差异显著,不能代表总体,或者说样本,就认为差异显著,不能代表总体,或者说二者有本质的差别,不是属于同一个总体,这种二者有本质的差别,不是属于同一个总体,这种判断有判断有95%的可靠性。的可靠性。952.52.5x 的的p5 代表总体代表总体x 的的p5 不不能代表总体能代表总体3.2 差异显著性测验的原理差异显著性测验的

35、原理n同理:如果样本均数出现的概率等于或小于同理:如果样本均数出现的概率等于或小于1%,即在即在99%范围外,抽样范围外,抽样100次有次有99次得不到此样次得不到此样本,则认为样本平均数与总体平均数间的差异极本,则认为样本平均数与总体平均数间的差异极显著,更没有代表性,这种判断有显著,更没有代表性,这种判断有99%可靠。可靠。99 0.5 0.5x 的的p1 不不能代表总体能代表总体3.2 差异显著性测验的原理差异显著性测验的原理n进行差异显著性测验,一般都是用样进行差异显著性测验,一般都是用样本平均数作比较,因此必须要计算平本平均数作比较,因此必须要计算平均数标准差均数标准差或或平均数差数

36、标准差平均数差数标准差,以,以此来估计样本平均数或平均数差数出此来估计样本平均数或平均数差数出现的概率,作为测验差异是否显著的现的概率,作为测验差异是否显著的依据。依据。3.2 差异显著性测验的原理差异显著性测验的原理n1、平均数标准差、平均数标准差l如果在一群体中连续多次抽取同样大小如果在一群体中连续多次抽取同样大小的样本,计算每次取样的平均数,则这的样本,计算每次取样的平均数,则这些平均数并不是一致的,而在一定范围些平均数并不是一致的,而在一定范围内变动,它对于总体的平均数也有差异,内变动,它对于总体的平均数也有差异,这就是平均数标准差(也称均数标准这就是平均数标准差(也称均数标准误)。误

37、)。l它表示平均数抽样误差的大小,是衡量它表示平均数抽样误差的大小,是衡量样本平均数代表性程度的重要依据,平样本平均数代表性程度的重要依据,平均数标准差愈小,代表性愈大,反之则均数标准差愈小,代表性愈大,反之则愈小。愈小。总总体体n x1 x2n1 xn第一样本平均数第一样本平均数1x x1 x2n2 xn第二样本平均数第二样本平均数2x x1 x2nk xn第第k样本平均数样本平均数kx 3.2 差异显著性测验的原理差异显著性测验的原理axbxcxdxexfxgxhx样本数样本数(n=8)观察值观察值平均平均数数a10121114131114b9789756c798710129d111312

38、14121612e8791091113f12151314121115g1516141212138h8121391076一个总体内抽取样本平均数计算表一个总体内抽取样本平均数计算表8个平均数不相同,对于总体平均数是有差异的个平均数不相同,对于总体平均数是有差异的3.2 差异显著性测验的原理差异显著性测验的原理n总体平均数标准差用总体平均数标准差用 代表,计算公式:代表,计算公式: x)73()(22nnxx取样个数取样个数总体平均数总体平均数样本平均数样本平均数nx)73()(/)(222nxnnxnx n在实际工作中,总体标准差在实际工作中,总体标准差往往是未知往往是未知的,因而无法求得的,因

39、而无法求得 。此时,可用样本。此时,可用样本标准差标准差s s 估计估计于是,以于是,以 估计估计 。记记 为为 ,称作,称作样本标准误或均数标样本标准误或均数标准误。样本标准误准误。样本标准误 是平均数抽样误差是平均数抽样误差的估计值。的估计值。若样本中各观测值为若样本中各观测值为 n则则 xnsxnsxsxs1x2xnx)83() 1(/)(22nnnxxnssx3.2 差异显著性测验的原理差异显著性测验的原理3.2 差异显著性测验的原理差异显著性测验的原理n注意,样本标准差与均数标准误是既有联注意,样本标准差与均数标准误是既有联系又有区别的两个统计量,上式已表明了系又有区别的两个统计量,

40、上式已表明了二者的联系。二者的区别在于:二者的联系。二者的区别在于:n 样本标准差样本标准差 s 是反映样本中各观测是反映样本中各观测值值 , , 变异程度大小的一个指变异程度大小的一个指标,它的大小说明了标,它的大小说明了 对该样本代表性的对该样本代表性的强弱。强弱。n平均数标准差平均数标准差 是样本平均数是样本平均数 的标准差,它是抽样误差的估计值,其大的标准差,它是抽样误差的估计值,其大小说明了样本间变异程度的大小及精确性小说明了样本间变异程度的大小及精确性的高低。的高低。kxxx,.,211x2xnxxxs3.2 差异显著性测验的原理差异显著性测验的原理n计算样本平均数标准差计算样本平

41、均数标准差 的目的,是的目的,是要了解取样的平均数在一群体中出现的要了解取样的平均数在一群体中出现的概率,以便测验样本平均数的可靠程度概率,以便测验样本平均数的可靠程度或进行差异显著性测验。或进行差异显著性测验。n在比较两个样本平均数之间的差异,进在比较两个样本平均数之间的差异,进行差异显著性测验时,也要以平均数标行差异显著性测验时,也要以平均数标准差(误)为依据。准差(误)为依据。xs3.2 差异显著性测验的原理差异显著性测验的原理n2、平均数差数的标准差、平均数差数的标准差n从同一总体随机抽取两组样本,这两从同一总体随机抽取两组样本,这两组样本的平均数相减所得的差数叫组样本的平均数相减所得

42、的差数叫平平均数差数均数差数,如连续抽很多对样本,并,如连续抽很多对样本,并求出平均数的差数,则此众多的平均求出平均数的差数,则此众多的平均数差数也在一定范围内波动,也可以数差数也在一定范围内波动,也可以用标准差来表示其变异程度,这种标用标准差来表示其变异程度,这种标准差就叫平均数差数标准差(或差数准差就叫平均数差数标准差(或差数标准误)。标准误)。 x1 x2n1 xn第一组样本平均数第一组样本平均数1x x1 x2n2 xn第二组样本平均数第二组样本平均数2x1x2x( )1总总体体n x1 x2n2 xn第二组样本平均数第二组样本平均数2x x1 x2n1 xn第一组样本平均数第一组样本

43、平均数1xn对平均数差对平均数差数呈波动性数呈波动性 1x2x( )21x2x( )n用平均数差数用平均数差数标准差估计标准差估计3.2 差异显著性测验的原理差异显著性测验的原理n同样,研究两个总体,分别从总体同样,研究两个总体,分别从总体1中抽中抽取一个随机样本,从总体取一个随机样本,从总体2中抽取另一个中抽取另一个随机样本,这两个样本的均值之差,也随机样本,这两个样本的均值之差,也叫平均数差数,如果分别从两个总体中叫平均数差数,如果分别从两个总体中抽取很多对随机样本,求出平均数差数,抽取很多对随机样本,求出平均数差数,则这些众多的平均数差数也在一定范围则这些众多的平均数差数也在一定范围内波

44、动,也可以用标准差来表示其变异内波动,也可以用标准差来表示其变异程度,这种标准差就叫程度,这种标准差就叫平均数差数标准平均数差数标准差。差。 1x2x( )1n对平均数对平均数差数也呈差数也呈现波动性现波动性1x2x( )n用平均数差数用平均数差数标准差估计标准差估计 x1 x2n2 xn2x总总体体n2 x1 x2n1 xn1x总总体体n12211继续抽样继续抽样3.2 差异显著性测验的原差异显著性测验的原n(1)成组数据平均数差数标准差)成组数据平均数差数标准差l成组数据又叫不成对数据。如:成组数据又叫不成对数据。如: n两个试验处理的设计为完全随机,对环境两个试验处理的设计为完全随机,对

45、环境条件的影响不加以控制,而处理间的供试条件的影响不加以控制,而处理间的供试单位为彼此独立,数据不成配对,两处理单位为彼此独立,数据不成配对,两处理样本容量可以相同,也可以不同的试验得样本容量可以相同,也可以不同的试验得到的数据称为成组数据。如:到的数据称为成组数据。如: l其中其中n1、n2可相等,可不相等。可相等,可不相等。处处 理理12345样本容量样本容量施施 药药9080857995n1=5不施药不施药100999895100n2=53.2 差异显著性测验的原理差异显著性测验的原理n两总体方差两总体方差12和和22已知或两总体方差未知,已知或两总体方差未知,但两样本容量但两样本容量n

46、130、 n230,两样本平均,两样本平均数比较进行数比较进行u测验时,平均数差数标准差测验时,平均数差数标准差的计算的计算)93(222121)(21nsnssxxs12,n1分别为第一样本方差和样本容量分别为第一样本方差和样本容量s22,n2分别为第二样本方差和样本容量分别为第二样本方差和样本容量3.2 差异显著性测验的原理差异显著性测验的原理n由于总体方差未知,上式利用两样本的方由于总体方差未知,上式利用两样本的方差差s12、s22估计两总体方差估计两总体方差12 、22)93(222121)(21nsnssxx) 1(/)(11212121nnxxs) 1(/)(22222222nnx

47、xs3.2 差异显著性测验的原理差异显著性测验的原理n如果两样本总体方差如果两样本总体方差12和和22为未知,但假为未知,但假设设12= 22= 2,且两样本均为小样本,且两样本均为小样本(n130, n230 ),进行),进行t测验时,用两测验时,用两个样本个样本s12和和s22的加权平均数的加权平均数s2 估计估计2精确精确性更高。因此:性更高。因此:)103()11(212)(21nnssxx3.2 差异显著性测验的原理差异显著性测验的原理n其中:其中:n当当n1=n2=n时,(时,(3-10)可变为)可变为) 1() 1(/)(/)() 1() 1() 1() 1(2122222121

48、21212221212nnnxxnxxnnnsnss)123(2)2(22)21(nsnssxx(3-11)3.2 差异显著性测验的原理差异显著性测验的原理n(2)成对数据平均)成对数据平均数差数标准差数差数标准差n试验的两个处理采取对试验的两个处理采取对比排列,设若干重复,比排列,设若干重复,每次重复都是把两处理每次重复都是把两处理安排在相邻的小区组成安排在相邻的小区组成配对,这种设计取得的配对,这种设计取得的数据就是成对数据。数据就是成对数据。n如甲、乙两种农药药效如甲、乙两种农药药效对比试验,分对比试验,分5次进行。次进行。 处理处理样号样号甲甲乙乙d=x1x211815321216-2

49、31716142218451619-3ix甲x乙x将差数作为一组变数求差数将差数作为一组变数求差数标准差和差数标准误标准差和差数标准误3.2 差异显著性测验的原理差异显著性测验的原理n成对数据,其平均数差数标准差的计算方成对数据,其平均数差数标准差的计算方法,先分别求出每对差数法,先分别求出每对差数d(d=x1x2),再,再把这些差数作为一组变数来求差数标准差把这些差数作为一组变数来求差数标准差sd和和差数平均数标准差差数平均数标准差 。)133(1/2)(212)(nnddnddds)143() 1(/2)(2nnnddndsdsds三、平均数差异显著性三、平均数差异显著性测验的方法测验的方

50、法3.3 差异显著性测验的方法差异显著性测验的方法n1、统计假设、统计假设l首先对试验样本所在的总体作两个假设首先对试验样本所在的总体作两个假设u无效假设无效假设h0 :l无效假设是被检验的假设,通过检验可无效假设是被检验的假设,通过检验可能被接受,也可能被否定,提出能被接受,也可能被否定,提出h0的同的同时相应地提出一个对应假设时相应地提出一个对应假设u备择假设备择假设ha :l是在无效假设被否定时准备接受的假设是在无效假设被否定时准备接受的假设3.3 差异显著性测验的方法差异显著性测验的方法n单个平均数的假设测定单个平均数的假设测定n无效假设无效假设l表示某个样本估计的总体均数与原来的表示

51、某个样本估计的总体均数与原来的总体均数没有显著的差异;总体均数没有显著的差异;记作:记作:n备择假设备择假设l表示某个样本估计的总体均数与原来的表示某个样本估计的总体均数与原来的总体均数有显著的差异;总体均数有显著的差异;记作:记作:0000h:或或ah:000或或3.3 差异显著性测验的方法差异显著性测验的方法n两个平均数相比较的假设测定两个平均数相比较的假设测定l无效假设无效假设l表示某二个样本估计的总体均数与原来表示某二个样本估计的总体均数与原来的总体均数无显著差异的总体均数无显著差异;l备择假设备择假设l表示某二个样本估计的总体均数与原来表示某二个样本估计的总体均数与原来的总体均数有显

52、著差异。的总体均数有显著差异。21021或或:ah:0h或或21=12=03.3 差异显著性测验的方法差异显著性测验的方法n2、确定显著水准(或统计区间)、确定显著水准(或统计区间)l如何才能判断如何才能判断h0是否正确?就需要一是否正确?就需要一个标准。个标准。l显著水平:显著水平:统计推断时,衡量差异显统计推断时,衡量差异显著性程度的概率标准,称为显著性水著性程度的概率标准,称为显著性水平,以平,以表示。表示。l常用显著水平常用显著水平 =0.05 称为称为5%的显著水平的显著水平=0.01 称为称为1%的显著水平的显著水平 3.3 差异显著性测验的方法差异显著性测验的方法n在统计假设检验

53、中在统计假设检验中“接受接受”或或“否定否定”所提出的所提出的“无效假设无效假设” h0的概率范围,的概率范围,称称为统计区间。为统计区间。包括接受区间和否定区间:包括接受区间和否定区间:3.3 差异显著性测验的方法差异显著性测验的方法n统计上:统计上:当当1%p 5%称所测差异显著称所测差异显著u否定否定h0,接受,接受ha 当当p 1%称所测差异极显著称所测差异极显著u否定否定h0,接受,接受ha 当当p5%称所测差异不显著称所测差异不显著u接受接受h0n因此因此 ,统计假设测验又叫,统计假设测验又叫差异显著性测验。差异显著性测验。3.3 差异显著性测验的方法差异显著性测验的方法(一)连续

54、性数据的假设测验(一)连续性数据的假设测验n1、总体参数、总体参数和和已知的已知的平均数平均数假设测假设测验验(平均数的(平均数的u测验)。测验)。n测验时具备以下条件:测验时具备以下条件:l总体参数总体参数0和和2为已知为已知 。l总体参数总体参数0已知,已知,2 为未知,但为未知,但 为大样本(为大样本(n30)可用)可用s2估计估计,即即nssxnx用用代替。代替。3.3 差异显著性测验的方法差异显著性测验的方法n单个样本平均数单个样本平均数u测验的方法步骤:测验的方法步骤:n(1)提出无效假设与备择假设)提出无效假设与备择假设n其中其中 为样本所在总体平均数,为样本所在总体平均数, 为

55、已知为已知总体平均数;总体平均数;n(2)计算平均数标准误)计算平均数标准误00:h0:ah0nx3.3 差异显著性测验的方法差异显著性测验的方法n (3)计算标准正态离差()计算标准正态离差(u)n(4)从)从附表附表2查出相应查出相应u值值区间范围外的区间范围外的概率。若查出的概率概率。若查出的概率p0.05为差异不显为差异不显著著,若若p0.05即为差异显著即为差异显著,如果如果p0.01则为差异极显著。则为差异极显著。l当当=0.05时,时,u u0.05 =1.96 差异不显著差异不显著l当当=0.05时,时,u u0.05 =1.96 差异显著差异显著l当当=0.01时,时,u u

56、0.01 =2.58 差异极显著差异极显著nxxux/3.3 差异显著性测验的方法差异显著性测验的方法n【例【例32】假定有某水稻品种,据以往】假定有某水稻品种,据以往进行大量调查观察的结果,平均株高为进行大量调查观察的结果,平均株高为102厘米(厘米(=102),标准差为),标准差为28厘米厘米(=28),由该品种经辐射诱变后选出),由该品种经辐射诱变后选出的后代,现调查的后代,现调查100株平均株高为株平均株高为95厘米厘米( =95),问与原品种的株高有无显著),问与原品种的株高有无显著差异。差异。n解:解:假定与原品种的株高没有显著差异假定与原品种的株高没有显著差异 l(1)设:)设:

57、 h0:=0 ha:0 x3.3 差异显著性测验的方法差异显著性测验的方法n(2)计算平均数标准误)计算平均数标准误n(3)计算正态离差)计算正态离差u值值lu=2.5 u0.05=1.96,差异显著差异显著lu=2.5 u0.01=2.58 未达差异极显著未达差异极显著n否定否定h0: 即诱变后代株高与原品种高度有即诱变后代株高与原品种高度有本质上的差异,这种判断可靠程度达本质上的差异,这种判断可靠程度达95%。)(8 . 210028厘厘米米nx厘米5 . 28 . 210295/nxxux3.3 差异显著性测验的方法差异显著性测验的方法n在实际检验时,因为在标准正态分布下:在实际检验时,

58、因为在标准正态分布下: p(|u|1.96)=0.05, p(|u|2.58)=0.01,n因此,在用因此,在用u分布作检验时,分布作检验时,l |u|1.96,表明概率,表明概率p0.05,可在,可在0.05水水平上否定平上否定h0;l |u|2.58,表明概率,表明概率p0.01,可在,可在0.01水水平上否定平上否定h0l|u|1.96,表明,表明p0.05,可接受,可接受h0,不必不必再计算实际的概率。再计算实际的概率。3.3 差异显著性测验的方法差异显著性测验的方法n上述平均株高上述平均株高 =95 已落入否定区,所以已落入否定区,所以冒冒5以下的风险否定以下的风险否定h0,推断诱变

59、品种与,推断诱变品种与原品种的株高有显著差异。原品种的株高有显著差异。xu0.05=1021.962.8=96.512+u0.05=102+1.962.8=107.488 3.3 差异显著性测验的方法差异显著性测验的方法n2、 总体参数未知的假设测验和总体参数未知的假设测验和 t 分布分布n当总体参数当总体参数已知,平均数比较可用已知,平均数比较可用u测测验:验:n当总体参数当总体参数未知,常用未知,常用 s代替代替来计算来计算标标准化离差准化离差u ,在,在n足够大足够大(n30)的大样本的大样本情况下,样本平均数抽样分布接近正态分情况下,样本平均数抽样分布接近正态分布,布,用用s计算的计算

60、的u值也接近正态分布。值也接近正态分布。nssxnx用用替代替代nxxux/3.3 差异显著性测验的方法差异显著性测验的方法l但当总体标准差但当总体标准差未知时,未知时,n30的小样本的小样本时,以样本标准差(时,以样本标准差(s)代替总体标准差)代替总体标准差()计算标准化离差计算标准化离差 的分布不呈正态分的分布不呈正态分布,而呈布,而呈 t 分布。分布。l上式上式s为样本标准差,为样本标准差, 为样本平均数标准为样本平均数标准误,误,n为样本容量。为样本容量。nsx/)153(/nsxsxtxxs3.3 差异显著性测验的方法差异显著性测验的方法nt 值的分布是值的分布是gosset ws

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论