生物统计学 总结-供参考_第1页
生物统计学 总结-供参考_第2页
生物统计学 总结-供参考_第3页
生物统计学 总结-供参考_第4页
生物统计学 总结-供参考_第5页
已阅读5页,还剩19页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计学 总结绪论统计工作的四大步骤:设计、搜集、整理、分析统计资料的三大类型:计量资料:对每个观察值单位用定量方法测得每项指标量的大小所得的资料计数资料:将观察单位按照某种属性类别分组,所得的观察单位数等级资料:将观察单位按某种属性的不同程度分组所得的资料同质与变异同质:除研究因素外,其他因素相同或相近为同质变异:观测值的不齐性总体与样本:总体:根据研究目的所确定的同质观察单位的全体=所有研究对象性质相同的全体观察单位某项变量值的集合总体含量:总体中所包含的观察单位数有限总体:总体观察单位数可数无限总体:总体观察单位数不可数样本:从总体中随机抽取的部分观察单位样本含量:样本中所包含的观察单

2、位数抽样:从总体中获得样本的过程放回式抽样不放回式抽样抽样误差:因个体变异的存在,由抽样而导致的样本指标与总体指标之差统计量:有样本所得指标或数参数:由总体所得指标,关于特征的表征频数:完全相同的观察只出现的次数频率:某一观察值出现的次数与样本含量的比值概率:描述某事物发生可能性大小的一个度量样本空间:一次实验所有可能的结果的集合基本事物:样本空间每一个可能的结果小概率事件:P=0.05或P120个)才足够稳定,所以当样本含量不够大时,不宜取两端百分位数3)用百分位数确定正常值范围,习惯上95%离散趋势的描述1. 极差R:样本资料中最大值和最小值之差在一定程度上能说明样本波动幅度的大小,但它只

3、受样本中两个极端个体数值大小的影响,不能反映样本中各个观测值的变异程度,稳定性差2. 四分位数间距:是上四分位数与下四分位数之差,用四分位数间距可反映变异程度的大小.稳定性好,灵敏度不够3. 标准差:定义:描述一组同质计量资料离散程度大小的指标反映了均数对一组观察值的代表性说明了观察值围绕均数分布的离散程度,个体变异计算:应用:表示变量分布的离散程度结合均数描述正态分布特征结合均数计算变异系数结合样本含量计算标准误注意:不同单位,相同标准差,不能比较大个体差异大,变异度大,小个体则变异度小4.变异系数CV定义:标准差与均数之比,用百分数表示计算:应用:单位不同的几组资料变异度及均数相差悬殊的几

4、组资料的变异度的比较,不单独使用自由度泛指可以自由取值的变量的个数正常值:正常动植物解剖生理生化等各种数据的波动范围必要性区分正常和异常看不同种群在不同时间地域上某一指标的差异选取极差中的一部分单侧或双侧正常值之分,由指标实际情况及实验要求确定方式之一为正常值范围的百分位数,习惯上95%双侧:确定P2.5或P97.5单侧:P5或P95,看实验需要计量资料的统计推断统计推断用样本信息推断总体特征参数估计:由样本结果对总体参数在一定概率水平下所做出的估计假设检验正态分布概念:一种连续型随机变量的概率分布密度函数:分布函数:特征:在横轴上均数处最高以均数为中心,左右对称有两个参数曲线下的面积分布有一

5、定的规律F(x)应用:以曲线下的面积反映频率及概率分布估计正常值范围或正常值范围的正态分布法双侧正常值范围质量控制正态分布是很多种统计方法的理论基础标准正态分布,u分布U与面积的关系对数正态分布原观察值x呈偏态(正偏),取对数后,lgX呈正态分布x服从对数正态分布均数的抽样误差定义:平均数与总体均数之差均数抽样误差大小的度量标准误定义:样本均数的标准差意义:反映抽样误差的大小是样本均数围绕总体均数分布的离散程度,衡量了样本均数的可靠程度计算:一般一次抽样估计总体没有标准误,只针对样本用途:计算可信区间(参数估计)用于统计推断(假设检验)t分布t变换与t变量t分布的特征单峰,一0为中心,左右对称

6、曲线中间比正态分布低,两端翘得比正态分布高有无数根,中间越低,两端越翘t分布与自由度有关,自由度越小,中间越低,两端越翘当自由度趋向无穷时,t分布趋向标准正态分布,tu概率密度函数与分布函数t介值与t介值表t,:给定自由度为,两侧双尾面积之和为时,相应t值。t分布原理:P(-t,= t = t,)=1-方差分析方差分析又叫变量分析,俗称F检验用途:两个或多个均数的比较分离各有关因素,并分别估计其对变异的作用分析两个或多个因素的交互作用方差齐性检验适用条件(用于多个均数比较时)个样本是相互独立的随机样本小样本要求正态方差齐基本思想:把全部观察值之间的变异,总变异,按设计需要,分为两个或多个组成部

7、分再作分析计算总体均数的估计总估计区间估计:定义:按一定的概率估计总体均数在什么范围内可信区间:按一定的概率估计总体均数的可能范围方式:t分布法:按t分布的原理估计总体均数在什么范围内适用于总体标准差未知且n50总体标准差已知:n50:假设检验为什么做假设检验检验差别是否由抽样误差造成的基本思想假定差别是由抽样误差引起的然后计算由抽样误差引起这么大,甚至比这更大的差别的概率P根据小概率原理,作出拒绝或者接受假设的判断步骤建立假设,确定检验水准先确定是单侧还是双侧的若考虑u,u0有误差别双侧若不仅考虑差别,还关注u,u0大小单侧一般认为双侧无效假设H0:从反证法的基础上提出的,无论何时,假设差别

8、是由抽样误差造成的,但具体问题具体分析备择假设H1:与H0相对立的假设,是依H0而产生的,一旦H0不成立,只能接受H1,现在H0不成立非H0体现单双侧之分检验水准:界定小概率事件的一个标准(有单双侧之分)通常=0.05选定检验方法,计算统计量确定P值,做出统计推断P值:指由H0所规定的总体中做随机抽样,获得等于大于或小于现有统计量的概率。若P,接受H0第一类错误和第二类错误第一类:拒绝实际上成立的H0第二类:不拒绝实际上不成立的H0客观实际拒绝H0不拒绝H0H0成立第一类错误()推断正确(1-)H0不成立推断正确(1-)第二类错误()可信度 1-把握度 :未知,只能估计,不能单独存在,只有与H

9、1结合才有意义检验效能1-:计量总体却有差别,按水准,能够发现他们有差别的能力注意样本的代表性组间的均衡性资料的可比性选用的假设检验方法一定要符合其适用条件正确理解差别有无显著性的含义(显著、极显著 不意味着差别的大小)结论不能绝对化报告要规范化检验方法一、完全随机设计(一)样本均数与已知总体均数比较的假设检验小样本,总体标准差未知t检验(要求 x 取自正态总体)大样本,总体标准差未知:t检验(严格)法2 无需来自正态总体u检验(,tu)法1大样本,总体标准差已知u检验(二)两个样本均数比较的假设检验小样本(有一个就算),总体标准差未知,正态方差齐t检验先求合并方差再求两样本均数差的标准误计算

10、t值小样本(有一个就算),总体标准差未知,方差不齐(非正态)采用适当的变量变换使达到方差齐性的要求采用不要求方差齐的方法比较非参数统计采用近似的t检验大样本u检验(不考虑正态方差齐的情况下,仍可用t检验)(三)两个样本几何均数比较的假设检验对x取反对数,用t检验或者u检验(四)多个样本均数的比较(单因素方差分析)条件:个样本是相互独立的随机样本小样本要求正态方差齐 *多个样本均数间的两两比较q检验二、配对设计(一)配对设计的计量资料的比较小样本,t检验t=dSd/n三、配伍组设计(一)多个样本均数的比较(两因素方差分析)多个性质相同的配伍,同一配伍组中的N个受试对象分别接受k种处理作用:1.可

11、改善处理组间的均衡性2.可分析配伍因素的的影响3.提高设计效率,分析两个因素 *多个样本均数间的两两比较q检验正态性检验一、为什么做正态性检验特定统计方法要求的描述统计 平均数、标准差 正常值范围的正态统计法统计推断 t检验 F检验二、定义判定资料是否服从正态分布或样本是否来自正态总体的一类检验方法三、何时用?为了说明资料是否服从正态分布一定要做为了满足特定统计方法的需要可以不做四、怎么做?正态分布分布的特征:对称性偏度(正偏、对称、负偏)三阶 偏度系数 g1 态峰翘度(正态峰、尖峭峰、平阔峰)四阶 峰度系数 g2方差齐性检验一、为什么?t检验 F检验 使用条件的要求方差的抽样波动二、定义说明

12、变量值的变异度有无差别,或者通过样本信息来推断总体方差是否相等的一类检验方法三、何时做?说明变量值的变异度有无差别时一定做为满足t、F检验方差齐性要求的可不做四、如何做?多个方差的齐性检验X2检验变量变换意义:通过改变观察值的原初形式,使资料正太化,达到方差齐性的要求,以满足t检验及方差分析的应用条件依据:只改变观察值的分布形式,而不是其相对大小常用方法:对数变换:以观察值x的对数值作为新的分析数据常用方式 适用场合:使服从对数正态分布的资料正态化使方差达到方差齐性要求,特别是标准差与均数的比值接近时使指数曲线直线化,常用于曲线拟合平方根变换:以原观察值x的平方根作为新的分析数据常用方式适用场

13、合:使服从Poisson分布的计数资料或轻度偏态资料正态化使各样本的方差与均数的正比例关系消除或削弱,达到方差齐性要求百分数、平方根、正反弦变换以原观察值用百分数表示,平方根反正弦值作为新的分析数据适用场合:总体百分数小于30%或大于70%的情形计数资料的统计描述和推断相对数(一)为什么引入绝对数不能做进一步分析(二)什么是相对数同一基础上,两个有联系指标之比*常用指标率/频率指标:用以说明某现象发生的频率与强度计算比例基数依习惯而用 使算的的率至少保留1-2位整数构成比/构成指标:用以说明某一事物内部各组成部分所占的比重或分布总和为100%计算*若总和不为100%:超减于大,低加在小相对比:

14、两个有关同类指标之比,用以说明两者的对比水平计算 *指标可为平均数、绝对数、相对数动态数列:一系列按时间顺序排列起来的统计指标,用以说明事物延时间发展的变化与趋势*指标可为平均数、绝对数、相对数*动态分析:(1)绝对增量=统计期指标基期指标说明事物在一定时期增加的绝对数量可分为逐年的、逐期的:后比前,内部波动累计的:基期固定,总体结果发展速度、增长速度:反映事物在一定时期的速度变化,可分为定基与环基发展速度=统计期指标/基期指标增长速度=发展速度1(三)应用相对数应注意的问题计算相对数的分母一般不宜过小,对于动物实验,可减小分析时不能以比代率计算观察单位不等的几个率的平均值时,不能直接相加求平

15、均资料的对比应注意可比性率和构成比也可有抽样误差假设检验二项分布及其应用(一)概念及其应用条件对于某个性状,常常可以把其资料分成两个类型。即“非此即彼”两种情况,彼此构成对立事件,我们把这种“非此即彼”事件所构成的总体,称为二项总体,其概率分布称为二项分布。二项分布的概率密度函数:重复做n次相互独立的实验,每次实验有相互独立的结果,P(A)= P(A)=1-,则n次实验中A恰好发生x次的概率实验有,则可用二项分布处理分布函数特征:=0.5 对称,正态0.30.7 近似对称,近似正态0.7 或 0.3 偏态严重,离0.5越远,偏的越厉害二项分布近似正态分布的条件:,1- 均大于0.01 不接近0

16、或1n,n(1-) 均大于5 n足够大二项分布的均数和标准差、(二)二项分布的应用1.总体率的可信区间点估计区间估计查表法正态近似法(条件)样本率与已知总体率比较的假设检验直接计算概率法利用二项分布的概率密度和分布函数,求出p值,与所用的检验水准进行比较,做出统计推断适用条件:偏离0.5较远,x较小正态近似法(条件)两个样本率比较的u检验(条件)Poisson分布及其应用(一)概念及应用条件是二项分布的一个特例,当或1-很小(40,Ti5时,上式近似X2*可以利用X2值检验实际频数与按假设检验计算的理论频数是否相等的问题*如果假设成立,那X2 0;不应出现大X2的概率P40,T5TRC=nRn

17、CnTmin=nRminnCminn=R-1C-1四格表资料处理阳性数阴性数合计阳性率1aba+b2cdc+d合计a+cb+dnX2基本公式的专用公式X2=ad-bc2na+bc+da+cb+d n40,T5X2校正公式X2=A-T-0.52T n40,1T40,1T5四格表的确切概率法P=a+b!c+d!a+c!b+d!N!a!b!c!d! n40 或 T40时可不校正两种处理有无相关(双向有序列联表)X2=ad-bc-n22a+bc+da+cb+dRC 列联表X2检验基本数据中多于四格表用途:多个样本率的比较样本构成比的比较(三个以上)计数资料的相关分析基本思想、基本公式、自由度的计算同前

18、X2=A2nRnC-1应用条件:1.n402.1T5的格子数不能超过总格子数的1/53.不能有T1的格子T过小的处理:增大样本含量n合并相应的行或列删除相应的行或列*多个样本率/构成比的比较,结论为拒绝H0时,认为有差别,但不知其具体,应两两比较*如果分组标志是双因素的,若其中一组分组标志有序单向有序列联表。若分析构成比X2检验,否则用秩和检验(一)多个样本率的比较(k2表)(二)两个样本构成比的比较(可推多个)(2k表)(三)计数资料的相关分析(双向有序列联表)频数分布拟合优度的X2检验判定样本频数分布是否符合某一理论Pi=Fu2-Fu1=Fx2-x1-=行-1非参数统计*不依赖于总体的分布

19、形式,应用时忽略分布类型是否已知*检验时比较分布而非参数*适用范围广,不受分布形式限制*可用于不能活未能精确测量的资料,尤其适用等级资料或适合于算中位数*前提为变量变换后仍不能达到正态缺点:检验效能低=参数统计30%适用场合:等级资料偏态分布(经变换后不能正态,近似L型)开口资料分布不清的方差不齐(经变换后仍不能达到齐性)常用方法:符号检验 秩和检验 超越检验 游程检验 等级相关分析秩和检验配对比较的符号秩和检验两个样本比较的秩和检验多个样本比较的秩和检验多个样本两两比较的秩和检验t检验相关与回归分析直线相关概念两变量间的关系直线相关分析:找出一个适当的指标来描述两个变量间的直线相关关系、相关

20、密切程度及方向是怎样的适用条件:双变量正态分布或正态双变量相关系数(指标)定义:描述两个变量间有无直线变量关系及密切程度样本r 总体意义:通过取值描述不同的相关情形相关系数的计算r=0 推出 =0 r的假设检验 t检验等级相关用等级数据做直线相关分析适用场合:1.不服从双变量正态分布的2.总体分布型未知的3.原始数据使用等级表示的等级相关系数:表明两变量间的相关密切程度样本rs 总体srs的检验:1.查表法 2.t检验直线回归一、概念研究两变量在数量上的依存关系直线回归方程 y=a+bx+*用容易测量的变量推算不易测得的变量*对资料的要求:1.正态双变量:x y & y x 的两个方程(不同)

21、2.至少有一个是正态变量,必须是y要求x是精确测定的二、直线回归方程1.一般表达式*数学模型:Y=a+bx+*一般表达式:2.系数a、b的求法直线回归方程的图示回归系数的假设检验方差分析(F检验)回归系数b的t检验回归方程的应用描述两变量间的依存关系以容易测得的变量去推测不易测得的变量利用回归方程进行预测预报(一个区间)把变量x带入回归方程中去估计Y利用直线回归方程进行控制应用注意要有实际意义资料要符合要求自变量和因变量的选择要符合实际直线回归的范围只限于取得原始资料的范围直线回归方程可以内插,一般不能外延回归方程必须经过检验相关与回归的区别与联系区别相关回归资料要求正态双变量至少有一个为正态变量意义反映相关关系反映依存关系应用说明有无相关关系说明有无依存关系rb意义描述两变量间有无相关关系及相关的密切程度和方向的指标x增减一个单位,y平均改变b个单位范围-1,1(-,+)单位无y单位或x单位联系:对同一正态双变量资料,如果计算得r、b,则r与b符号一致相关系数的假设检验与回归系数的假设检验一致,对同一资料,tr=tbr与b的数值关系

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论