




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、高级高级生物统计学生物统计学第三章第三章 多年多点试验结果的联合分析多年多点试验结果的联合分析第一章第一章 单个自由度比较分析单个自由度比较分析第二章第二章 裂区试验设计及其统计分析裂区试验设计及其统计分析第四章第四章 曲线回归分析曲线回归分析第五章第五章 多元回归分析多元回归分析第六章第六章 协方差分析协方差分析第七章第七章 一次回归正交设计及其统计分析一次回归正交设计及其统计分析生物统计学基本知识回顾生物统计学基本知识回顾第八章第八章 二次回归正交设计及其统计分析二次回归正交设计及其统计分析第九章第九章 二次旋转设计及其统计分析二次旋转设计及其统计分析基本知识回顾基本知识回顾第三节第三节
2、生物统计学的基本方法生物统计学的基本方法第一节第一节 生物统计学的基本概念生物统计学的基本概念第四节第四节 田间试验及设计方法田间试验及设计方法第二节第二节 生物统计学的基本原理生物统计学的基本原理第五节第五节 方差分析方差分析第六节第六节 直线回归分析直线回归分析生物统计学及其特点生物统计学及其特点 生物统计学生物统计学(Biometry or Bio-statisticsBiometry or Bio-statistics)是数学是数学中的概率论与数理统计学在生物科学中的应用而形成的一中的概率论与数理统计学在生物科学中的应用而形成的一门系统性学科。门系统性学科。统计学统计学理论统计学即数理
3、统计学理论统计学即数理统计学应用统计学应用统计学社会科学领域的统计学社会科学领域的统计学自然科学领域的统计学自然科学领域的统计学1.1.逻辑性较强;逻辑性较强;2.2.假设较多,比较抽象;假设较多,比较抽象;3.3.统计方法的分析过程复杂;统计方法的分析过程复杂;4.4.规律性较强;规律性较强;5.5.分析方法的分析步骤不具灵活性。分析方法的分析步骤不具灵活性。其特点其特点: :第一节第一节 生物统计学的基本概念生物统计学的基本概念 1.1.数据数据(datadata)在科学试验或调查过程中,对在科学试验或调查过程中,对研究对象的某些特征、特性进行观察记载得到的数研究对象的某些特征、特性进行观
4、察记载得到的数字资料的总称。字资料的总称。数据具有数据具有变异性变异性和和趋中性趋中性。 2.2.变数变数(variablevariable)生物个体具有变异性的特征、生物个体具有变异性的特征、特性。特性。变数的某一具体数值称为变数的某一具体数值称为变量变量(variate)或或观观测值测值(observed value) 。 连续性变数连续性变数(continuous variable)是指观测值在是指观测值在一定范围内可以取任何一个数值,这些观测值一般是通一定范围内可以取任何一个数值,这些观测值一般是通过测量或称量的方法获得的。过测量或称量的方法获得的。 离散性变数离散性变数(discon
5、tinuous or discrete variable)是指观测值只能取是指观测值只能取0或正整数的变数,其观测值一般通或正整数的变数,其观测值一般通过观察和计数的方法获得的。过观察和计数的方法获得的。第一节第一节 生物统计学的基本概念生物统计学的基本概念3.3.总体总体(population or universepopulation or universe) 根据研究根据研究目的而确定的,具有共同性质的个体所组成的集目的而确定的,具有共同性质的个体所组成的集团,或者说是整个研究对象中每个个体某一变数团,或者说是整个研究对象中每个个体某一变数所有观测值的总称所有观测值的总称。5.5.样本样
6、本(samplesample)从总体中抽出一部分有代表从总体中抽出一部分有代表 性的个体或观测值性的个体或观测值。4.4.总体的总体的参数参数或或参量参量(parameter) parameter) 根据总体全根据总体全体观测值算出的总体特征数体观测值算出的总体特征数。常用希腊字母表示。常用希腊字母表示。 如总体平均数如总体平均数 ,方差,方差 2 2,标准差标准差 等。等。6.6.统计数统计数或或统计量统计量(statasticstatastic)根据样本所有根据样本所有观测值计算出的样本特征数。常用英文字母表示。例观测值计算出的样本特征数。常用英文字母表示。例如样本平均数如样本平均数 ,方
7、差,方差S S2 2,标准差标准差S S等等。x第一节第一节 生物统计学的基本概念生物统计学的基本概念l 算术平均数算术平均数: :7.7.平均数平均数(average or meanaverage or mean)是数据的代表值,是数据的代表值,表示资料中观测值的中心位置。表示资料中观测值的中心位置。l 中中( (位位) )数数(medianmedian): :l 众数(众数(modemode): :l 几何平均数几何平均数(geometric meangeometric mean): : 所有观测值的总和除以观测值所有观测值的总和除以观测值 数目所得的商。数目所得的商。 将资料所有观测值排
8、序后,将资料所有观测值排序后,居于中间位置的那个观测值的值(或,当观测值数居于中间位置的那个观测值的值(或,当观测值数目为偶数时,那两个观测值的和之半目为偶数时,那两个观测值的和之半) )。 资料中最常见的一数,或次数分布资料中最常见的一数,或次数分布表中次数最多的那组的组中值。表中次数最多的那组的组中值。 n个观测值的乘个观测值的乘积的积的n次方根。次方根。其中以算术平均数最为常用。其中以算术平均数最为常用。第一节第一节 生物统计学的基本概念生物统计学的基本概念l极差极差(range) range) 一组数据的最大值与最小值之差。一组数据的最大值与最小值之差。 8.8.变异数变异数表示数据资
9、料变异大小的数值。表示数据资料变异大小的数值。l 离均差平方和离均差平方和简称简称平方和平方和( (sum of squaressum of squares,SSSS) ) 可可较好地衡量资料的变异较好地衡量资料的变异。 定义公式定义公式: 计算公式计算公式: : 其中其中C为为矫正数矫正数,为资料中所有观测值总和的平方除,为资料中所有观测值总和的平方除以观测值的个数。以观测值的个数。2)(xxSSCxnxxSS222/)(第一节第一节 生物统计学的基本概念生物统计学的基本概念8.8.变异数变异数表示数据资料变异大小的数值。表示数据资料变异大小的数值。l方差方差(variance)(varia
10、nce)是平方和除以观测值的个数。是平方和除以观测值的个数。总体方差总体方差(population variance):population variance):NxNSSNii/)(/212样本方差样本方差(sample variance):sample variance):)1/()()1/(212nxxnSSsniiNxfNSSkii/)(/212 分类资料分类资料: : 分类资料分类资料: :) 1/()() 1/(212nxxfnSSskii第一节第一节 生物统计学的基本概念生物统计学的基本概念8.8.变异数变异数表示数据资料变异大小的数值。表示数据资料变异大小的数值。l标准差标准差
11、(standard deviation)(standard deviation)是方差的正根值是方差的正根值。总体标准差总体标准差(Population SD):Population SD):NNxxNx/ /)(/)(222 样本标准差样本标准差(Sample SD):Sample SD):) 1/(/)() 1/()(222nnxxnxxsl变异系数变异系数( (Coefficient of Variation,Coefficient of Variation,记为记为C.V.C.V. ) )是指资料的标准差与平均数之比。即:是指资料的标准差与平均数之比。即:%100/.xsVC不可能事件
12、不可能事件自然界中每一件事物的每一种可能出现的情况。自然界中每一件事物的每一种可能出现的情况。第二节第二节 生物统计学的基本原理生物统计学的基本原理随机事件随机事件事件事件概率概率每一个事件出现的可能性每一个事件出现的可能性。必然事件必然事件在特定情况下必定发生的事件;在特定情况下必定发生的事件;在特定情况下不可能发生的事件;在特定情况下不可能发生的事件;在特定情况下可能发生也可能不发在特定情况下可能发生也可能不发生的事件;生的事件;某事件出现的概率用某事件出现的概率用P( P( ) )表示;例如表示;例如P(AP(A) )、 P(BP(B) )等。等。概率的有效范围为概率的有效范围为0 01
13、 1,即,即00P(AP(A)1)1。必然事件记为必然事件记为 ,其概率为其概率为1 1,即,即 P(P( ) = 1) = 1。不可能事件记为不可能事件记为 ,其概率为其概率为0 0,即,即 P(P( ) = 0) = 0。随机事件的概率在随机事件的概率在0 01 1之间,即之间,即0 0P(AP(A) )1 1。1.1.事件事件(event)(event)与概率与概率(probability)(probability)第二节第二节 生物统计学的基本原理生物统计学的基本原理l 事件间的关系事件间的关系事件事件A A和和B B至少有一件发生的事件,记为至少有一件发生的事件,记为A+BA+B。
14、和事件和事件事件事件A A和和B B同时发生的事件,记为同时发生的事件,记为ABAB。 积事件积事件 互斥事件互斥事件两件不可能同时发生的事件,例如两件不可能同时发生的事件,例如AB=AB= 。 对立事件对立事件两件不可能同时发生,两者中必定有一件两件不可能同时发生,两者中必定有一件发生的事件,例如发生的事件,例如AB=AB= 同时同时A+B=A+B= 。 事件系事件系n 个事件两两互斥,但其必定有一件发个事件两两互斥,但其必定有一件发生,例如生,例如A Ai iA Aj j= = 同时同时A A1 1+A+A2 2+ +A+An n= = 。 事件的独立性事件的独立性 若若事件事件A A发生
15、与否不影响事件发生与否不影响事件B B发生的发生的 概率则称事件概率则称事件A A与事件与事件B B相互独立。相互独立。 完全事件系完全事件系完全互斥事件系完全互斥事件系几个相互有联系的事件放在一起几个相互有联系的事件放在一起。各事件的和事件为必然事件的事件系,各事件的和事件为必然事件的事件系,记为记为A A1 1+A+A2 2+ +A+An n= = 。第二节第二节 生物统计学的基本原理生物统计学的基本原理l 计算事件概率的法则计算事件概率的法则 假定两互斥事件假定两互斥事件A A和和B B的概率的概率分别为分别为P(A)P(A)和和P(B)P(B),则事件则事件A A与与B B的和事件的概
16、率的和事件的概率等于事件等于事件A A的概率与事件的概率与事件B B的概率之和。的概率之和。 互斥事件的加法定律互斥事件的加法定律可以引伸到:可以引伸到:n 个两两互斥的事件的概率等于这个两两互斥的事件的概率等于这 n 个事件的概率之和。个事件的概率之和。即:如果即:如果AB=AB= ,则则P(A+B)=P(A)+P(B)P(A+B)=P(A)+P(B)。即:如果即:如果A Ai iA Aj j= = ,则则P(P( A Ai i) )= = P(AP(Ai i)。第二节第二节 生物统计学的基本原理生物统计学的基本原理l 计算事件概率的法则计算事件概率的法则 互斥事件的加法定律互斥事件的加法定
17、律 假定假定P(A)P(A)和和P(B)P(B)是两独立是两独立事件事件A A和和B B各自出现的概率,则事件各自出现的概率,则事件A A与与B B同时出同时出现的概率等于事件现的概率等于事件A A的概率与事件的概率与事件B B的概率之乘积。的概率之乘积。 独立事件的乘法定律独立事件的乘法定律可以引伸到:可以引伸到:n 个相互独立的事件同时发生概率等于个相互独立的事件同时发生概率等于这这 n 个事件各自发生的概率之乘积。个事件各自发生的概率之乘积。即:即:P(ABP(AB) )= =P(A)P(B)P(A)P(B)。对立事件的概率对立事件的概率 若事件若事件A A的概率为的概率为 ,则其对则其
18、对立事件立事件 的概率为的概率为 。AP(A)-1)AP(P(A) 完全互斥事件系的概率之和完全互斥事件系的概率之和为为1 1。即,如果即,如果A Ai iA Aj j= = 同时同时A A1 1+A+A2 2+ +A+An n= = ,则则P(P( A Ai i)=1)=1。第二节第二节 生物统计学的基本原理生物统计学的基本原理2.2.二项分布二项分布(binomial distribution):(binomial distribution):由对立事件构由对立事件构成的总体称为成的总体称为二项总体二项总体(binomial populationbinomial population),
19、,二项总体观测值的概率分布即为二项总体观测值的概率分布即为二项分布二项分布。若某事件出现的概率为若某事件出现的概率为p p,其对立事件出现的概率为其对立事件出现的概率为q=q=1 1-p-p,做做n n次重复独立试验,该事件出现次重复独立试验,该事件出现X X次的可能性次的可能性( (概率概率) )有多大?现在是:有多大?现在是:n n=2=2,p=p=3/43/4,q=q=1/41/4,X X可以为可以为0 0,1 1,2 2。P(P(X X=0)=(1)(1/4)(1/4)=(1) (3/4)=0)=(1)(1/4)(1/4)=(1) (3/4)0 0(1/4)(1/4)2 2=(1) p
20、=(1) p0 0q q2-02-0P(P(X X=1)=(2)(3/4)(1/4)=(2) (3/4)=1)=(2)(3/4)(1/4)=(2) (3/4)1 1(1/4)(1/4)1 1=(2) p=(2) p1 1q q2-12-1P(P(X X=2)=(1)(3/4)(3/4)=(1) (3/4)=2)=(1)(3/4)(3/4)=(1) (3/4)2 2(1/4)(1/4)0 0=(1) p=(1) p2 2q q2-22-2其中系数为在其中系数为在n n个中取个中取X X个进行组合的数目。个进行组合的数目。xnxxnxnxxnqpxC)41()43(C)(P所以,概率分布函数为:所
21、以,概率分布函数为:第二节第二节 生物统计学的基本原理生物统计学的基本原理l 比较下面两个概率分布图,会发现二项分布的形状比较下面两个概率分布图,会发现二项分布的形状是由是由n和和p两个参数决定的。当两个参数决定的。当 p = q = 0.5 时,分布是时,分布是对称的;当对称的;当 p q 时,分布就不对称;时,分布就不对称; p和和q差异越大,差异越大,分布就越偏斜。分布就越偏斜。p= 0.35, q = 0.65 时:时:p= 0.15, q = 0.85 时:时:第二节第二节 生物统计学的基本原理生物统计学的基本原理l利用概率分布表,可以计算出随机变量利用概率分布表,可以计算出随机变量
22、 X的总体平均的总体平均 数数 和总体方差和总体方差 2。x p 0 1 n nnqp00C111Cnnqp0CqpnnnpXnnqp00(0)C111(1)Cnnqp0)C(qpnnnnXnp0np1npn 2)(Xpnnqp-np002C)(01112C)(1nnqp-np02C)(qpn-npnnnnpqpXCnXxnxxn0l对数列求和得对数列求和得 X的总体均数为:的总体均数为:npqqpCnpXnXxnxxn022)(l同法求得同法求得 X 的总体方差为:的总体方差为:npql将方差开平方得将方差开平方得 X 的总体标准差为:的总体标准差为:第二节第二节 生物统计学的基本原理生物统
23、计学的基本原理l 于是,随机变量于是,随机变量X落在区间(落在区间(X1 1, ,X2 2) )内的概率为:内的概率为:3.3.正态分布正态分布(normal distribution)(normal distribution)连续性变数的概率连续性变数的概率分布分布, ,其概率密度函数为:其概率密度函数为: 记为记为 其中其中 为为X的平均数,的平均数, 为为X的方差。的方差。222)(21)(xexf),(N2X2l 其概率分布函数为:其概率分布函数为:dxexFxx222)(21)(dxexxxxxx22212)(2121)(P第二节第二节 生物统计学的基本原理生物统计学的基本原理 -
24、-2 + +2 - -3 - - + + +3 f( (x) )xl 正态曲线的特性:正态曲线的特性: 单峰,倒钟状,当单峰,倒钟状,当X= = 时,时,f( (x) )达最大值;达最大值; 当当X 时,时,f( (x) )0 0; 以以X= 为轴左右对称为轴左右对称; 曲线与横轴间面积为曲线与横轴间面积为1 1; 在在X= 处有两个拐点;处有两个拐点; 若若 不变不变, 改变使曲线左右平移改变使曲线左右平移, 形状不变;形状不变; =0时,时, 对称轴与纵轴重合;说明对称轴与纵轴重合;说明 代表了数据的中心位置;代表了数据的中心位置; 当当 不变,不变, 改变使曲线形状改变,对称轴不变;改变
25、使曲线形状改变,对称轴不变; 当当 变小时,曲线变高瘦,中部的面积变大;当变小时,曲线变高瘦,中部的面积变大;当 变变 大时,曲线变矮胖,中部的面积变小;说明大时,曲线变矮胖,中部的面积变小;说明 衡量了衡量了 资料的变异程度。资料的变异程度。面积占面积占68.27%面积占面积占95.45% X的某区间内曲线的某区间内曲线 与横轴之间的面积就与横轴之间的面积就是随机变量是随机变量X落在该区间落在该区间 的概率。这部分的面的概率。这部分的面 积是如何计算的呢?积是如何计算的呢?第二节第二节 生物统计学的基本原理生物统计学的基本原理dueuuuxxxdxexxxuuuxxx221212)(2122
26、1222121)(P)(P21)(P ,那么将有:,那么将有:l 如果将服从如果将服从 分布的随机变量分布的随机变量X进行变换:进行变换:),(2NXu222)(XudXXddududx,。2211,XuXu 于是原变量于是原变量X在区间在区间( (X1 1, ,X2 2) )之间的概率就可以用之间的概率就可以用u在区在区 间间( (u1 1, ,u2 2) )之间的概率来计算。之间的概率来计算。 这个这个u称为正态离差称为正态离差 u的密度函数记为:的密度函数记为:并称为并称为标准正态分布标准正态分布密度函数。密度函数。2221)(ueu相应地记标准正态相应地记标准正态分布的概率函数为:分布
27、的概率函数为:dueuuu2221)(因为因为X的平均数为的平均数为 ,方差为,方差为 2 2, ,所以所以 的平均数为的平均数为:方差为:方差为:Xu0Xu11)(1)(222XVarXVaruVar)()(12uul 统计学家已经将标准正态分布的概率计算出来,我们统计学家已经将标准正态分布的概率计算出来,我们 只要学会查表就可以计算对应于不同的只要学会查表就可以计算对应于不同的u的的 ( (u) )值。值。第二节第二节 生物统计学的基本原理生物统计学的基本原理l 统计学一个主要任务是研究总体和样本之间的关系统计学一个主要任务是研究总体和样本之间的关系l 总体和样本之间的关系可以从两个方向进
28、行研究:总体和样本之间的关系可以从两个方向进行研究: 从总体到样本:即研究从总体中抽出的从总体到样本:即研究从总体中抽出的所有可能样所有可能样本本的的统计数的分布统计数的分布及其及其与原总体之间的关系与原总体之间的关系。即。即抽抽样分布样分布的情况。的情况。 从样本到总体:即研究从总体中抽出的一个随机样从样本到总体:即研究从总体中抽出的一个随机样本,本,用该样本用该样本的统计数来的统计数来估计总体估计总体的参数,即的参数,即参参数估计数估计;对总体对总体的参数的参数作出推断作出推断,即,即统计假设测统计假设测验验。4.4.抽样分布抽样分布(sampling distribution)(samp
29、ling distribution)研究样本统计数研究样本统计数的概率分布。的概率分布。第二节第二节 生物统计学的基本原理生物统计学的基本原理l 研究样本的方法研究样本的方法 对于对于比较小比较小的总体,可以将总体中的总体,可以将总体中所有可能的样本所有可能的样本都都抽出来进行研究样本统计数的分布。抽出来进行研究样本统计数的分布。 对于对于较大或无限较大或无限总体,可以从中抽出总体,可以从中抽出比较多的样本比较多的样本来来研究样本统计数的分布。研究样本统计数的分布。l 抽样又分为抽样又分为复置抽样复置抽样和和不复置抽样不复置抽样 复置抽样复置抽样 将抽得的个体将抽得的个体放回放回总体继续参加抽
30、样。总体继续参加抽样。不复置抽样不复置抽样 抽得的个体抽得的个体不放回不放回总体参加后续的抽样。总体参加后续的抽样。l大数定律大数定律:对客观事物进行足够多地观察,客观事物的:对客观事物进行足够多地观察,客观事物的规律性就会充分显现出来。规律性就会充分显现出来。 大数定律保证了大数定律保证了参数估计的可靠性参数估计的可靠性。统计上。统计上 xE E( )= = , E E(S2)= = 2, E(S), E(S) 第二节第二节 生物统计学的基本原理生物统计学的基本原理l 样本平均数的抽样分布样本平均数的抽样分布l 如果有一个总体,大小为如果有一个总体,大小为N,平均数为平均数为 ,方差为,方差
31、为 2。从这总体中抽取一个大小从这总体中抽取一个大小为为 n 的样本,可以算出样的样本,可以算出样本平均数本平均数 。x 这个这个 不是常不是常数,而是一个随机变量。数,而是一个随机变量。因为你下次再从这总体中抽因为你下次再从这总体中抽取一个大小为取一个大小为 n 的样本的样本, ,这这个个 的值就不同了。的值就不同了。xx如果如果N是个有限大的数,将一共有是个有限大的数,将一共有m= =N n种可能的样本。种可能的样本。如果如果N是个无限大的数,则是个无限大的数,则m是个无限大的整数。这是个无限大的整数。这m个个 可以构成一个总体。称为样本平均数的衍生总体。可以构成一个总体。称为样本平均数的
32、衍生总体。xl 统计学已经证明,样本平均数总体的平均数等于原总统计学已经证明,样本平均数总体的平均数等于原总 体的平均数,样本平均数总体的方差等于原总体方差体的平均数,样本平均数总体的方差等于原总体方差 的的n分之一。即分之一。即 , , xnx/22l 两个独立样本平均数差数的总体分布两个独立样本平均数差数的总体分布l 如果从一个具有参数如果从一个具有参数 1 1, , 1 12的的正态正态总体中抽取大小为总体中抽取大小为 n1的样本,样本的样本,样本平均数为平均数为 ;又从另;又从另一个具有参数一个具有参数 2 2, , 2 22 的的正态正态总体中抽取大小为总体中抽取大小为n2的样本,样
33、本的样本,样本平均数平均数 为为 。则两样本平均数之差数。则两样本平均数之差数 将服从总将服从总 体平均数为体平均数为 ,总体方差为,总体方差为 的正态分布。的正态分布。1x2x21xxd2221212222121nnxxxx2121xxl 将将 转换为正态离差转换为正态离差 就可以计算出差数就可以计算出差数 落在某区间的概率。落在某区间的概率。21xxd21xxd2221212121)()(nnxxul 如果两个独立样本来自如果两个独立样本来自同一非正态总体同一非正态总体,即具有相同,即具有相同 的参数的参数 和和 2,则只有当则只有当n1n2都足够大时,两样本平都足够大时,两样本平 均数之
34、差数均数之差数 才服从上述的正态分布。才服从上述的正态分布。21xxdl 如果两个独立样本来自如果两个独立样本来自不同不同的的非正态总体非正态总体,只有当,只有当 1 12 2 22 ,且且n1n2都足够大时,两样本平均数之差数都足够大时,两样本平均数之差数 才近似服从正态分布。否则分布很难确定。才近似服从正态分布。否则分布很难确定。21xxd第二节第二节 生物统计学的基本原理生物统计学的基本原理l 请注意,上面讨论到的抽样总体,不论是请注意,上面讨论到的抽样总体,不论是 样本平均数总体样本平均数总体 还是还是 两样本平均数之差数的总体两样本平均数之差数的总体 其样本平均数和方差与原总体的平均
35、数和方差都有相其样本平均数和方差与原总体的平均数和方差都有相应的关系,应的关系,与原总体的分布无关与原总体的分布无关。l 如果原总体的分布为已知,则相应的抽样总体的分布如果原总体的分布为已知,则相应的抽样总体的分布 就更为清楚了。就更为清楚了。l 以下讨论原总体的分布与相应的抽样总体的分布之间以下讨论原总体的分布与相应的抽样总体的分布之间的关系。的关系。第二节第二节 生物统计学的基本原理生物统计学的基本原理l 实际应用中,当实际应用中,当n30时,就可以应用此定理。时,就可以应用此定理。l 如果如果原总体服从正态分布原总体服从正态分布 ,则,则无论样本容无论样本容 量量n是大是小是大是小,样本
36、平均数样本平均数 将服从平均数为将服从平均数为 , , 方差为方差为 的正态分布。即的正态分布。即),(2Nxxnx/22)/,(N),(N22nxxxl 如果如果原总体不是正态分布原总体不是正态分布的,但已知其总体均数为的,但已知其总体均数为 , 方差为方差为 ,则当从中抽取的,则当从中抽取的样本容量样本容量n足够大足够大时,中心时,中心 极限定理指出,极限定理指出,样本平均数样本平均数 将服从平均数为将服从平均数为 , 方差为方差为 的正态分布。即的正态分布。即2xxnx/22)/,(N),(N22nxxxl 将将 转换为正态离差转换为正态离差 u,就可以计算出,就可以计算出 落在某区间的
37、落在某区间的 概率。概率。xx第二节第二节 生物统计学的基本原理生物统计学的基本原理l 在前面介绍了标准化正态分布即在前面介绍了标准化正态分布即u u分布的定义公式:分布的定义公式: 。现在由此可以衍生出另外两个。现在由此可以衍生出另外两个u u值的值的计算公式,即符合正态分布的样本平均数和样本平均计算公式,即符合正态分布的样本平均数和样本平均数差数衍生总体的数差数衍生总体的u u值转换公式:值转换公式:xxu样本平均数衍生总体:样本平均数衍生总体:样本平均数差数衍生总体:样本平均数差数衍生总体:Xu2111)()(22xxxxu正态总体中的数值正态总体中的数值正态总体的平均数正态总体的平均数
38、正态总体的标准差正态总体的标准差第二节第二节 生物统计学的基本原理生物统计学的基本原理l 学生氏学生氏分布分布 t= t= l 若随机变量若随机变量t的概率密度函数为:的概率密度函数为:则称随机变量则称随机变量t服从自由度为服从自由度为n-1的的t分布。分布。22)11 (1)21()2()1(1)(nntnnntfl 分布曲线的特性:分布曲线的特性: 单峰,倒钟状,以单峰,倒钟状,以 t = 0为轴左右对称为轴左右对称; 不同的不同的df有不同的曲线,当有不同的曲线,当df小时,曲线肥矮,小时,曲线肥矮,当当df大大 时,曲线高瘦,当时,曲线高瘦,当df时,曲线与标准正态曲线重合;时,曲线与
39、标准正态曲线重合; 曲线与横轴间面积为曲线与横轴间面积为1 1。xsxnsx/第二节第二节 生物统计学的基本原理生物统计学的基本原理f( (t) )tdf=5df=10df=30正态正态第二节第二节 生物统计学的基本原理生物统计学的基本原理l 根据前面介绍了二项总体的理论分布,二项总体是根据前面介绍了二项总体的理论分布,二项总体是由对立事件构成的总体,其总体的观测值是由抽样次由对立事件构成的总体,其总体的观测值是由抽样次数数“n n”来定义的,因此同一种二项总体因来定义的,因此同一种二项总体因n n值不同,值不同,其总体内的观测值种类多少也是不相同的,这给研究其总体内的观测值种类多少也是不相同
40、的,这给研究其抽样分布带来了困难。其抽样分布带来了困难。 为此,可将出现此事件记为为此,可将出现此事件记为X=1X=1,出现彼事件记为出现彼事件记为X=0X=0,这样二项总体的观测值都转换为这样二项总体的观测值都转换为0 0和和1 1的总体,这种总体的总体,这种总体称为称为“二项分布的两点总体二项分布的两点总体”,以后统称二项总体。,以后统称二项总体。l先计算出这样的总体的平均数和方差。先计算出这样的总体的平均数和方差。 若此事件出现的概率为若此事件出现的概率为p,彼事件出现的概率为彼事件出现的概率为q=1-p,可以计算出总体平均数可以计算出总体平均数 = =p p和总体方差和总体方差 2=p
41、q。其实这其实这就是前面所介绍的二项总体就是前面所介绍的二项总体“n=1n=1”的情况。的情况。 =(1=(1 p p+0+0 q q)/()/(p p+ +q q)=)=p p 2 2 =(=(p p (1-(1-p p) )2 2+ +q q (0-(0-p p) )2 2)/()/(p p+ +q q) ) =( =(pqpq2 2+ +qpqp2 2) /() /(p p+ +q q)=)=pqpq第二节第二节 生物统计学的基本原理生物统计学的基本原理l二项总体平均数的抽样分布二项总体平均数的抽样分布 根据前面所介绍的知识,当根据前面所介绍的知识,当n n比较大时,比较大时, 构成的分
42、构成的分布可近似符合正态分布,可将其转换为布可近似符合正态分布,可将其转换为u u值或值或t t值:值:x从此总体中抽取大小为从此总体中抽取大小为n的样本,样本平均数的样本,样本平均数 X/n将服从平均数为将服从平均数为p,方差为方差为pq/n的二项分布。的二项分布。这里所这里所 说的样本平均数是指成数或百分数,也可用说的样本平均数是指成数或百分数,也可用 表示表示。 p npqnppp22,nqpppspptnpqppppupp/,/p 第二节第二节 生物统计学的基本原理生物统计学的基本原理 从两个二项总体中抽出两个样本容量分别为从两个二项总体中抽出两个样本容量分别为n n1 1和和n n2
43、 2的的样本,两个样本平均数差数样本,两个样本平均数差数d= d= 将服从平均数为将服从平均数为p1-p2,方差为方差为 的二项分布的二项分布。l二项总体平均数差数的抽样分布二项总体平均数差数的抽样分布21pp 22211122p 1p 212p 1p nqpnqp,pp222111nqpnqp同样地,如果两个样本的容量都比较大,差数的分布同样地,如果两个样本的容量都比较大,差数的分布也近似地符合正态分布,可以将其转换为也近似地符合正态分布,可以将其转换为u u值或值或t t值:值:212121212121)()(,)()(ppppspppptppppu第二节第二节 生物统计学的基本原理生物统
44、计学的基本原理l 2分布(卡平方分布)分布(卡平方分布)l 随机变量随机变量 2的概率密度函数为:的概率密度函数为: 则称随机变量则称随机变量 2服从自由度为服从自由度为n-1的的 2分布。分布。2122222)(221)(enfnn从一正态总体从一正态总体N N( , , 2)中抽出一个样本,这个中抽出一个样本,这个样本的观测值转换为样本的观测值转换为u u值,所有值,所有u u的平方之和定义的平方之和定义为为 2 2。如果将所有样本容量为。如果将所有样本容量为n n的样本都抽出,的样本都抽出,得到很多的得到很多的 2 2值构成了值构成了卡平方分布卡平方分布。即。即2222222) 1()(
45、)(snxXXx第二节第二节 生物统计学的基本原理生物统计学的基本原理l 2分布曲线的特性:分布曲线的特性: 20,图象都在第一象限,图象都在第一象限; 不对称的曲线,随着自由度不对称的曲线,随着自由度增加变得稍对称但顶峰变矮,增加变得稍对称但顶峰变矮,并逐渐趋向正态分布。并逐渐趋向正态分布。 df3时,时,曲线与横轴间面积为曲线与横轴间面积为1 1;df 3时,时,曲曲线与纵横两轴间面积为线与纵横两轴间面积为1 1。df =1df =3df =5f( ( 2) ) 2第二节第二节 生物统计学的基本原理生物统计学的基本原理 2分布总体虽然是从正态总体衍生来的,但是它解决分布总体虽然是从正态总体
46、衍生来的,但是它解决的问题主要是离散型变数资料,尤其是计数资料。的问题主要是离散型变数资料,尤其是计数资料。使用较多的不是它的定义公式使用较多的不是它的定义公式而是它的计算公式而是它的计算公式222) 1(snxiiiEEOx22)(l 分布分布l 随机变量随机变量的概率密度函数为:的概率密度函数为: 则称随机变量则称随机变量服从第一自由度为服从第一自由度为n1 -1-1的、第二自由度的、第二自由度 为为n -1-1的的分布。分布。2211222121212111)1 ()(222)(nnnnFnnFnnnnnnFf第二节第二节 生物统计学的基本原理生物统计学的基本原理从一正态总体从一正态总体
47、N N( , , 2)中抽出样本容量分别为中抽出样本容量分别为n n1 1和和n n2 2的两个样本,两个样本方差的比值定义为的两个样本,两个样本方差的比值定义为F F值值。如果将该总体所有可能的样本都抽出,得到很多。如果将该总体所有可能的样本都抽出,得到很多的的F F值构成了值构成了F F分布分布。即。即 F F= =S S1 12 2/ /S S2 22 2l 分布曲线的特性:分布曲线的特性:0,图象都在第一象限,图象都在第一象限;曲线受两个自由度的影响,曲线受两个自由度的影响,随着自由度的增加趋向对称;随着自由度的增加趋向对称; 不对称的单尾型曲线,曲不对称的单尾型曲线,曲线与横轴间面积
48、为线与横轴间面积为1 1。第二节第二节 生物统计学的基本原理生物统计学的基本原理df1=1, df2= 5df1=2, df2= 5df1=5, df2= 4f( (F) )F F第三节第三节 生物统计学的基本方法生物统计学的基本方法1. 1. 统计假设测验统计假设测验: :通过对抽样调查得到的样本数据进行分通过对抽样调查得到的样本数据进行分析而对样本所来自的总体作出统计判断的方法。析而对样本所来自的总体作出统计判断的方法。l 一些常见的例子一些常见的例子: : (1)(1)产品检验产品检验: : 某产品某个技术指标值为某产品某个技术指标值为 , ,现从一批现从一批 该产品中抽取大小为该产品中
49、抽取大小为 的样本,测得样本平均数为的样本,测得样本平均数为 ,标准差为标准差为 ,试测验该批产品的该技术指标平均数,试测验该批产品的该技术指标平均数 是否与已知的是否与已知的 间有显著差异。间有显著差异。00 xsn (2)(2)品种比较品种比较: : 调查调查A A品种品种 株,平均产量为株,平均产量为 , ,标准标准 差为差为 ;调查;调查B B品种品种 株,平均产量为株,平均产量为 , ,标准差标准差 为为 ;试测验两品种的真正产量;试测验两品种的真正产量 与与 之间有无之间有无 显著差异。显著差异。1n2n1x2x1s122s* * 这种测验称为这种测验称为单个平均数的假设测验单个平
50、均数的假设测验。* * 这种测验称为这种测验称为两个平均数相比较的假设测验两个平均数相比较的假设测验。第三节第三节 生物统计学的基本方法生物统计学的基本方法l 统计假设统计假设 针对研究的问题对总体参数提出一对统计假设。其中:针对研究的问题对总体参数提出一对统计假设。其中: * * 认为试验的处理没有效应的假设称为认为试验的处理没有效应的假设称为无效假设无效假设 (H H0 0 - null hypothesis) - null hypothesis); * * 当当H H0 0不能被接受时所采纳的假设称为不能被接受时所采纳的假设称为备择假设备择假设 (H HA A - alternative
51、 hypothesis)- alternative hypothesis)。如果是对总体平均数提出假设,则如果是对总体平均数提出假设,则一个总体一个总体 H H0 0: : = = 0 0(C C)对对H HA A: : 0 0 H H0 0: : 0 0 对对 H HA A: : 0 0 H H0 0: : 0 0 对对 H HA A: : 0 0两个总体两个总体 H H0 0: : 1 1 = = 2 2 对对 H HA A: : 1 1 2 2 H H0 0: : 1 1 2 2 对对 H HA A: : 1 1 2 2 H H0 0: : 1 1 2 2 对对 H HA A: : 1
52、1 2 2如果是对总体方差提出假设,则如果是对总体方差提出假设,则一个总体一个总体 H H0 0: : 2 2= = 0 0 2 2 (C C)对对H HA A: : 2 2 0 0 2 2 H H0 0: : 2 2 0 0 2 2 对对 H HA A: : 2 2 0 0 2 2 H H0 0: : 2 2 0 0 2 2 对对 H HA A: : 2 2 0 0 2 2两个总体两个总体 H H0 0: : 1 1 2 2 = = 2 2 2 2对对 H HA A: : 1 1 2 2 2 2 2 2 H H0 0: : 1 1 2 2 2 2 2 2 对对 H HA A: : 1 1 2
53、 2 2 2 2 2 H H0 0: : 1 1 2 2 2 2 2 2 对对 H HA A: : 1 1 2 2 2 2 2 2第三节第三节 生物统计学的基本方法生物统计学的基本方法l 统计测验的基本方法和一般步骤统计测验的基本方法和一般步骤 :2.2.利用试验数据计算一个统计量的值。再根据该样本统利用试验数据计算一个统计量的值。再根据该样本统 计量的抽样分布,计算出当计量的抽样分布,计算出当H H0 0为正确时出现这样一个为正确时出现这样一个 值的概率。对不同资料进行测验时,由于统计量及其值的概率。对不同资料进行测验时,由于统计量及其 的分布不同,计算统计量和概率的公式有所不同。的分布不同
54、,计算统计量和概率的公式有所不同。3.3.当此概率小于预先设定的水平,就根据当此概率小于预先设定的水平,就根据“小概率事件小概率事件 实际上不可能发生实际上不可能发生”原理拒绝原理拒绝H H0 0,接受接受H HA A。该水平称该水平称 为显著水平为显著水平( (记为记为 ) )。常用的。常用的 为为5%或或1%。1.1.针对研究的问题提出一对统计假设。其中:针对研究的问题提出一对统计假设。其中: * * 认为试验的处理没有效应的假设称为认为试验的处理没有效应的假设称为无效假设无效假设 (H H0 0 - null hypothesis) - null hypothesis); * * 当当H
55、 H0 0不能被接受时所采纳的假设称为不能被接受时所采纳的假设称为备择假设备择假设 (H HA A - alternative hypothesis)- alternative hypothesis)。第三节第三节 生物统计学的基本方法生物统计学的基本方法l 两尾测验两尾测验 :接受区域位:接受区域位于中间于中间, ,否定区域位于两侧的否定区域位于两侧的. .-1.96 0 1.96 95%接受区域否定区域l 单尾测验单尾测验 :接受区域位:接受区域位于一侧于一侧, ,否定区域位于另一侧否定区域位于另一侧. .- 0 1.64 495%接受区域否定区域95%- - 4 - 1.64 0接受区域
56、否定区域第三节第三节 生物统计学的基本方法生物统计学的基本方法l 假设测验会出现两种不同类型的错误。假设测验会出现两种不同类型的错误。l 假设测验依据假设测验依据“小概率事件实际上不可能发生原理小概率事件实际上不可能发生原理”。 利用估计值来对总体的相应参数进行判断。这种判断利用估计值来对总体的相应参数进行判断。这种判断 不是绝对正确的,有可能会犯错误。不是绝对正确的,有可能会犯错误。 实际情况 0正确 0错误 判断为0正确 没有错误 第二类错误 Type II error 判断为0错误 第一类错误 Type I error 没有错误 l 假设测验中犯这两类型错误的概率有多大?假设测验中犯这两
57、类型错误的概率有多大?l 第一类错误是指:将一个正确的第一类错误是指:将一个正确的H H0 0错判为不正确。错判为不正确。例如,我们的例子中,例如,我们的例子中,H H0 0: : = = 0 0 vs H vs HA A: : 0 0如果本来如果本来 = = 0 0 ,但却判断为但却判断为 0 0 ,有多大可能?有多大可能?因为我们用因为我们用1-1- 的把握作推断,的把握作推断,只有当算出的测验值落在接受只有当算出的测验值落在接受区间以外,才会推翻区间以外,才会推翻H H0 0,所以,所以犯第一类错误的概率等于犯第一类错误的概率等于 。- -u 0 u 1- -否定区域否定区域接受区域接受
58、区域第三节第三节 生物统计学的基本方法生物统计学的基本方法l 假设测验会出现两种不同类型的错误。假设测验会出现两种不同类型的错误。l 假设测验依据假设测验依据“小概率事件实际上不可能发生原理小概率事件实际上不可能发生原理”。 利用估计值来对总体的相应参数进行判断。这种判断利用估计值来对总体的相应参数进行判断。这种判断 不是绝对正确的,有可能会犯错误。不是绝对正确的,有可能会犯错误。 实际情况 0正确 0错误 判断为0正确 没有错误 第二类错误 Type II error 判断为0错误 第一类错误 Type I error 没有错误 l 假设测验中犯这两类型错误的概率有多大?假设测验中犯这两类型
59、错误的概率有多大?l 第二类错误是指:将一个错误的第二类错误是指:将一个错误的H H0 0错判为正确。错判为正确。例如,我们的例子中,例如,我们的例子中,H H0 0: : = = 0 0 vs H vs HA A: : 0 0如果本来如果本来 0 0 ,但却判断为但却判断为 = = 0 0 ,有多大可能?有多大可能?我们称犯第二类错误的概率为我们称犯第二类错误的概率为 , 的计算比较复杂,的计算比较复杂,它要求真正的它要求真正的 为已知。为已知。 0 1- -接受区域接受区域接受区域接受区域 0 1- -接受区域接受区域 35 3699%第三节第三节 生物统计学的基本方法生物统计学的基本方法
60、l犯这两类型错误的概率犯这两类型错误的概率( ( 与与 ) )之间的关系。之间的关系。接受区域接受区域 35 3695% 如果样本容量如果样本容量n不变,不变, 减少,则减少,则 增大增大。35 3795%接受区域接受区域即提供置信度即提供置信度( (减小显著水平,或减少犯第一类错误减小显著水平,或减少犯第一类错误的概率的概率) ),将增大犯第二类错误的可能性;,将增大犯第二类错误的可能性;。 对于相同的对于相同的n和和 , 与与 0 0 相距越远,相距越远,则则 越小越小。 当当n、 、 与与 0 0都相同时,都相同时, 越小则越小则 越小越小。35 3695%接受区域接受区域l 两个样本平
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
评论
0/150
提交评论