生物统计学复习资料_第1页
生物统计学复习资料_第2页
生物统计学复习资料_第3页
生物统计学复习资料_第4页
生物统计学复习资料_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章生物统计学(Biostatistics)是数理统计在生物学研究中的应用,它是应用数理统计的原理和办法来分析和解释生物界多个现象和实验调查资料的一门学科。属于应用统计学的一种分支。是一门应用数学。统计学(Statistics)是把数学的语言引入具体的科学领域,将所研究的问题抽象为数学问题的过程,是收集、分析、列示和解释数据的一门科学。生物统计学是硕士命过程中以样本推断总体的一门学科。生物统计学的基本类容:试验设计:如何合理地进行调查或实验设计统计分析:如何科学地整顿、分析所收集来的含有变异的资料,揭示出隐藏其内部的规律性。生物统计学的基本作用:提供整顿和描述数据资料的科学办法,拟定某些性状和特性的数量特性。运用明显检查,判断实验成果的可靠性或可行性。提供由样本推断总体的办法。④提供实验设计的的某些重要原则。惯用的统计学术语:一.总体与样本含有相似性质的个体所构成的集合称为总体;总体有分为有限总体和无限总体。构成总体的基本单元称为个体从总体中抽出若干个体所构成的集合称为样本(sample);(总体中的一部分)构成样本的每个个体称为样本单位;样本中所包含的个体数目叫样本容量或样本大小,样本容量常记为n。普通在物学研究中,普通n<30的样本叫小样本,n≥30的样本叫大样本。参数与统计数描述总体特性的数量称为参数,也称参量。惯用希腊字母表达参数,例如用μ表达总体平均数,用σ表达总体原则差;描述样本特性的数量称为统计数,也称统计量。惯用英文字母表达统计数,例如用X-表达样本平均数,用S表达样本原则差。变量与常数变量,或变数,指相似性质的事物间体现差别性或差别特性的数据。常数,表达能代表事物特性和性质的数值,普通由变量计算而来,在一定过程中是不变的。变量涉及定量变量和定性变量,定性变量又可分为持续变量(能够有任何小数出现)和非持续变量(只有整数出现)。效应与互作通过施加实验解决,引发实验差别的作用称为效应。效应有正效应与负效应之分。互作,又叫连应,是指两个或两个以上解决因素间互相作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。误差与错误效应随机误差,抽样误差,偶然误差变异误差系统误差,片面误差随机误差,也叫抽样误差,是由于实验中无法控制的内在和外在的偶然因素所造成的实验成果与真实成果之间的差别。是不可避免的。统计上的实验误差普通都指随机误差。随机误差越小,实验精确性越高。系统误差,也叫片面误差,是由于实验解决以外的其它条件控制不一致所产生的带有倾向性的或定向性的偏差。系统误差重要由某些相对固定的因素引发的,如仪器调校的差别、各批药品间的差别、不同操作者操作习惯的差别等。系统误差影响实验的精确性。只要实验工作做得精细,系统误差是能够克服的。错误(mistake),是指在实验过程中,由于人为作用引发的差错。如测量仪器不准、试剂配制不当、实验人员粗心大意使称量、观察、记载、抄录、计算中出现错误等人为因素而引发的,只要以认真负责的态度和细心的工作作风,在实验中是完全能够避免的。原则上,实验中是不允许出现错误的。精确性与精确性精确性(accuracy),也叫精确度,指在调查或实验中某一实验指标或性状的观察值与其真值靠近的程度。设某一实验指标或性状的真值为μ,观察值为x,若x与μ相差的绝对值|x-μ|越小,则观察值x的精确性越高;反之则低。精确性(precision),也叫精确度,指调查或实验中同一实验指标或性状的重复观察值彼此靠近的程度。若观察值彼此靠近,即任意二个观察值xi、xj相差的绝对值|xi-xj|越小,则观察值精确性越高;反之则低。精确性不等于精确性。精确性是阐明测定值对真值符合的程度大小,而精确性是阐明多次测定值的变异程度大小。调查或实验的精确性、精确性合称为对的性。因素与水平解决与重复章节小测验1.变量按其性质能够分为___定量__变量和__定性____变量。2.样本统计数是总体______的预计值。3.生物统计学是硕士命过程中以__样本___来推断_总体____的一门学科。4.生物统计学的内容涉及______、______。5.生物学研究中,普通将样本容量______称为大样本。6.实验误差能够分为____、____两类。1.对于有限总体不必用统计推断办法。()2.资料的精确性高,其精确性也一定高。()3.在实验设计中,随机误差只能减小,而不可能完全消除。()4.统计学的实验误差,普通指随机误差。()第二章在生物学实验及调查中,通过对某种具体事物或现象观察获得的成果称为资料。变量:相似性质的事物间体现差别性的某项特性或性状。定量变量:通过测量所获得的,用品体的数值与特定计量单位体现的数据。持续变量:表达在变量范畴内可抽出某一范畴的全部值,变量之间是持续,无限的,能够有任何小数出现。非持续变量:表达在变量数列中仅能获得固定数值,并且普通是整数。定性变量:也称为分类变量,名义变量,其变量值是定性的,表达某个体属于几个互不相容的类型中的一种。数量性状是指能够以计数和测量或度量的方式表达其特性的性状。观察测定数量性状而获得的数据就是数量性状资料。数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。计数资料指用计数方式获得的数量性状资料。该类资料也称为非持续变量资料或间断变量资料或离散变量资料。计量资料指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。其数据是用长度、重量、容积、温度、浓度等来表达,要带单位。两个相邻的整数间能够有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定,计量资料也称为持续变量资料。质量性状资料:质量性状是指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是质量性状资料,也称为属性性状资料。这类性状本身不能直接用数值表达,要获得这类性状的数据资料,须对其观察成果作数量化解决,其办法有下列两种:统计次数法;评分法资料收集的办法:调查;实验。调查是对已经存在的事情的资料按某种方案进行收集的办法。资料的调查又能够分为两种:普查和抽样调查。普查是对研究对象的全部个体逐个进行调查的办法。抽样调查是根据一定的原则从研究对象中抽取一部分含有代表性的个体进行调查的办法。实验是对已有的或没有的事物加以解决的办法。实验设计须遵照的三大原则是:随机、重复和局部控制。常见的实验设计办法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等。检查和核对原始资料的目的:确保原始资料的完整性和对的性。计量资料的整顿普通采用组距式分组发全距→组数→组距→组限→归组→制表全距:样本数据资料中最大观察值与最小观察值之间的差值。R=Xmax-Xmin组数:是根据观察值的多少及组距的大小来拟定的。组距:组距=全距/组数组限:是指每个组变量值的起止界限。涉及上限和下限。组中值:是指每个组变量值的起止界限。第一组的组中值最佳靠近于资料的最小值。临界值就高不就低。分组是计数的办法:卡片法和唱票法(画正字法和画川字法。)。变量的分布含有两种明显的基本特性:集中性和离散性。集中性:是变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。离散性:是变量有着离中分散变异的性质。表达集中性的特性数:平均数(算术平均数,中位数,众数,集合平均数,调和平均数)表达离散性的特性数:极差,方差,原则差,变异系数算术平均数总体或样本资料中全部观察数的总和除以观察数的个数所得的商,简称平均数、均数或均值。总体:样本:中位数Md资料中全部观察数依大小次序排列,居于中间位置的观察数称为中位数或中数。当观察值个数n为奇数时,(n+1)/2位置的观察值,即Md=x(n+1)/2为中位数当观察值个数为偶数时,n/2和(n/2+1)位置的两个观察值之和的1/2为中位数众数M0资料中出现次数最多的那个观察值或次数最多一组的组中值或中点值。注意:(1)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以上的众数;(3)重要用来描述频率分布。④极差:是数据分布的两端变异的最大范畴,即样本变量值最大值和最小值之差,用R表达。一定程度上阐明样本波动幅度,但只受两个极端值大小的影响,不能反映样本中各个观察值的变异程度.…离均差:各个观察值与平均数的离差。离均差能够反映出一种观察值偏离平均数的性质和程度。平方和(SS)预计量必须符合一种特性:无偏性算术平均数的重要性质离均差之和等于零。离均差平方和最小。16.自由度:指当以样本的统计量来预计总体的参数时,样本中能够自由变动的变量的个数。自由度=样本个数-样本数据受约束条件的个数df=n-k17.方差:刻画了随机变量的取值对于其数学盼望的离散程度方差越大,离散程度越大样本:总体:18:原则差样本:总体:原则差特性原则差的大小,受多个观察数影响,如果观察数与观察数间差别较大,则离均差也大,因而原则差也大,反之则小各观察数加上或减去一种常数,其原则差不变;各观察数乘以或除以一种常数a(不为0),其原则差扩大或缩小a倍。原则差作用表达变量分布的离散程度。能够概括预计出变量的次数分布及各类观察数在总体中所占的比例。预计平均数的原则误。进行平均数的区间预计和变异系数计算。变异系数定义:样本的原则差除以样本平均数,所得到的比值就是变异系数。CV=s/x×100%特点:是样本变量的相对变异量,不带单位。能够比较不同样本相对变异程度的大小。自我测验资料按生物的性状特性可分为______和______。直方图合用于表达______资料的次数分布。变量的分布含有两个明显基本特性,即______和_______。反映变量集中性的特性数是_______,反映变量离散性的特性数是______.样本原则差的计算公式s=_________计数资料也称持续性变量资料,计量资料也称非持续性变量资料。资料中出现最多的那个观察值或最多一组的中点值,称为众数。变异系数是样本变量的绝对变异量下面变量中属于非持续性变量的是_____A.身高B.体重C.血型D.血压对某鱼塘不同年纪鱼的尾数进行统计分析时,可作成_____图来表达。条形B.直方C.多边形D.折线第三章事件必然事件(U):一定条件下必然出现。不可能事件(V):一定条件下必然不出现。随机事件(A):一定条件下可能出现。频率设事件A在n次重复实验中发生了m次,其比值m/n称为事件A发生的频率,记为:W(A)=m/n。概率事件A在n次重复实验中,发生了m次,当实验次数n不停增大时,事件A发生的频率W(A)就越来越靠近某一拟定值p,于是定义p为事件A发生的概率(probability),记为P(A)=p=大数定律:概率论中用来叙述大量随机现象平均成果稳定性的一系列定律的总称。样本容量越大,样本统计数与总体参数之差越小。简朴的概率计算。第四章统计推断:把实验的表面效应与误差大小相比较并由表面效应可能属误差的概率而作出推论的办法。由一种样本或一系列样本所得的成果来推断总体的特性。统计推断的任务:分析误差产生的因素拟定差别的性质排除误差干扰对总体特性做出对的判断3假设检查又叫明显性检查,是根据总体的理论分布和小概率原理,对未知或不完全懂得的总体提出两种彼此对立的假设,然后由样本的实际成果,通过一定的计算,作出在一定概率意义上应当接受的那种假设的推断。小概率原理概率很小的事件在一次抽样实验中实际是几乎不可能发生的。假设检查的环节:分析问题→提出假设→拟定明显水平→计算检查统计量→做出推断双尾检查与单尾检查成组数据:将实验单位完全随机分为两组,再随机各实施一解决,这样得到的数据称为成组数据,以组的平均数作为比较的原则。成组数据平均数比较的假设检查和配对数据平均数比较的假设检查都是检查两个样本平均数和。所属总体平均数和与否相等的检查办法。成组数据两个样本抽自不同总体,两个样本之间的变量没有任何关联。这样,不管两样本的容量与否相似,所得数据皆为成组数据。将性质相似的两个样本(供试单位)配成对,每一对除随机地予以不同解决外,其它实验条件应尽量一致,以检查解决的效果,所得的观察值称为成对数据。点预计:以样本统计量直接预计总体的对应参数。预计总体参数的统计量称为预计量普通来说,一种好的预计量应满足下列三个条件:无偏性、有效性和相容性。区间预计按一定的概率预计总体参数在哪个范畴。具体区间预计与点预计看书和ppt。第五章所谓2卡方,是指互相独立的多个正态离差平方值的总和,O为观察次数,E为理论次数,i=1,…,k为计数资料的分组数,自由度为df=k-1,依分组数及其互相独立的程度决定。2.独立性测验是测验两个变数之间是互相独立还是彼此有关的统计办法,是次数资料的一种有关研究。独立性检查:测验实际成果与理论比例与否符合;测验产品质量与否合格;测验实验成果与否符合某一理论分布。应用卡方进行独立性测验的无效假设是:H0:两个变数互相独立,对HA:两个变数彼此有关。计算过程:(1)将所得次数资料按两个变数作两向分组,排列成相依表;(2)根据两个变数互相独立的假设,算出每一组格的理论次数;(3)由(基本公式)或者变形公式算得卡方值。(4)这个x2的自由度随两个变数各自的分组数而不同,设横行分r组,纵行分c组,则df=(r-1)(c-1)。当观察的时,便接受H0,即两个变数互相独立;当观察的Oi-Ei-0.5)2Oi-Ei-0.5)2c2=Eic(根据以上判断写统计结论。(第五章ppt28)2×2列联表的x2(卡方)独立性测验2×2表的普通形式:

成果1

成果2累计解决1

解决2

O11

O12

O21

O22R1

R2累计

C1

C2Tdf=(2-1)(2-1)=1(1)基本公式,需持续矫正(ppt30页补充)变形公式二、2×C表的独立性测验2×C表是指横行分为两组,纵行分为C≥3组的相依表资料。在作独立性测验时,其=(2-1)(c-1)=c-1。由于c≥3,故不需作持续性矫正。第六章1.实验因素:实验中所研究的影响实验指标的因素或因素组合2.因素水平:每个实验因素的不同状态(解决的某种特定状态或数量上的差别)简称为水平。3.实验解决对受试对象予以的某种外部干预或方法,是实验实施因子水平的一种组合单因素解决解决多因素解决实验单位:在实验中能接受不同实验解决的独立的实验载体。事实上就是根据研究目的而拟定的观察总体。重复:在实验中,将一种解决实施在两个或两个以上的实验单位上。解决实施的实验单位数即为解决的重复数。第七章1.抽样需遵照的总的原则是:样本必须来自于所研究的总体样本必须能代表所研究的总体抽样办法必须与抽样目的相一致2.实验、调查的目的不同,实验、调查的办法不同、抽样的办法也不同随机抽样简朴随机抽样整群抽样分层抽样双重抽样次序抽样典型抽样3.(一)随机抽样法总体比较整洁、变异程度小、群体分布均匀,可用随机抽样法随机抽样法的原则是:总体内每一种体(数据)都有同等的机会进入样本样本中每一种体(数据)进入任何一种组的机会也是相等的随机抽样法能够完全排除个人的主观性随机抽样法是最简朴、最惯用的抽样办法4.随机抽样法有下列几个办法:抓阄法随机数字法伪随机数字法通过随机抽样法得到样本后,普通需计算样本的特性数,用以预计总体参数。几乎全部调查和实验都能够采用随机抽样法进行抽样。5.整群抽样和多层次抽样法从总体中抽取数个样本单位群,对单位群内的全部个体作全方面调查,或用整个单位群进行实验样本单位群的抽取既能够用随机抽样法得到,也能够有选择地获得5.在整群抽样的基础上,对抽得的样本单位群不作全方面调查,或不是整个

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论