生物统计学复习资料_第1页
生物统计学复习资料_第2页
生物统计学复习资料_第3页
生物统计学复习资料_第4页
生物统计学复习资料_第5页
已阅读5页,还剩17页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章生物记录学(Biostatistics)是数理记录在生物学研究中的应用,它是应用数理记录的原理和措施来分析和解释生物界多种现象和试验调查资料的一门学科。属于应用记录学的一种分支。是一门应用数学。记录学(Statistics)是把数学的语言引入详细的科学领域,将所研究的问题抽象为数学问题的过程,是搜集、分析、列示和解释数据的一门科学。生物记录学是硕士命过程中以样本推断总体的一门学科。生物记录学的基本类容:试验设计:怎样合理地进行调查或试验设计统计分析:怎样科学地整顿、分析所搜集来的具有变异的资料,揭示出隐藏其内部的规律性。生物记录学的基本作用:提供整顿和描述数据资料的科学措施,确定某些性状和特性的数量特性。运用明显检查,判断试验成果的可靠性或可行性。提供由样本推断总体的措施。④提供试验设计的的某些重要原则。常用的记录学术语:一.总体与样本具有相似性质的个体所构成的集合称为总体;总体有分为有限总体和无限总体。构成总体的基本单元称为个体从总体中抽出若干个体所构成的集合称为样本(sample);(总体中的一部分)构成样本的每个个体称为样本单位;样本中所包括的个体数目叫样本容量或样本大小,样本容量常记为n。一般在物学研究中,一般n<30的样本叫小样本,n≥30的样本叫大样本。参数与记录数描述总体特性的数量称为参数,也称参量。常用希腊字母表达参数,例如用μ表达总体平均数,用σ表达总体原则差;描述样本特性的数量称为记录数,也称记录量。常用英文字母表达记录数,例如用X-表达样本平均数,用S表达样本原则差。变量与常数变量,或变数,指相似性质的事物间体现差异性或差异特性的数据。常数,表达能代表事物特性和性质的数值,一般由变量计算而来,在一定过程中是不变的。变量包括定量变量和定性变量,定性变量又可分为持续变量(可以有任何小数出现)和非持续变量(只有整数出现)。效应与互作通过施加试验处理,引起试验差异的作用称为效应。效应有正效应与负效应之分。互作,又叫连应,是指两个或两个以上处理原因间互相作用产生的效应。互作也有正效应(协同作用)与负效应(拮抗作用)之分。误差与错误效应随机误差,抽样误差,偶尔误差变异误差系统误差,片面误差随机误差,也叫抽样误差,是由于试验中无法控制的内在和外在的偶尔原因所导致的试验成果与真实成果之间的差异。是不可防止的。记录上的试验误差一般都指随机误差。随机误差越小,试验精确性越高。系统误差,也叫片面误差,是由于试验处理以外的其他条件控制不一致所产生的带有倾向性的或定向性的偏差。系统误差重要由某些相对固定的原因引起的,如仪器调校的差异、各批药物间的差异、不一样操作者操作习惯的差异等。系统误差影响试验的精确性。只要试验工作做得精细,系统误差是可以克服的。错误(mistake),是指在试验过程中,由于人为作用引起的差错。如测量仪器不准、试剂配制不妥、试验人员粗心大意使称量、观测、记载、抄录、计算中出现错误等人为原因而引起的,只要以认真负责的态度和细心的工作作风,在试验中是完全可以防止的。原则上,试验中是不容许出现错误的。精确性与精确性精确性(accuracy),也叫精确度,指在调查或试验中某一试验指标或性状的观测值与其真值靠近的程度。设某一试验指标或性状的真值为μ,观测值为x,若x与μ相差的绝对值|x-μ|越小,则观测值x的精确性越高;反之则低。精确性(precision),也叫精确度,指调查或试验中同一试验指标或性状的反复观测值彼此靠近的程度。若观测值彼此靠近,即任意二个观测值xi、xj相差的绝对值|xi-xj|越小,则观测值精确性越高;反之则低。精确性不等于精确性。精确性是阐明测定值对真值符合的程度大小,而精确性是阐明多次测定值的变异程度大小。调查或试验的精确性、精确性合称为对的性。原因与水平处理与反复章节小测验1.变量按其性质可以分为___定量__变量和__定性____变量。2.样本记录数是总体______的估计值。3.生物记录学是硕士命过程中以__样本___来推断_总体____的一门学科。4.生物记录学的内容包括______、______。5.生物学研究中,一般将样本容量______称为大样本。6.试验误差可以分为____、____两类。1.对于有限总体不必用记录推断措施。()2.资料的精确性高,其精确性也一定高。()3.在试验设计中,随机误差只能减小,而不也许完全消除。()4.记录学的试验误差,一般指随机误差。()第二章在生物学试验及调查中,通过对某种详细事物或现象观测获得的成果称为资料。变量:相似性质的事物间体现差异性的某项特性或性状。定量变量:通过测量所获得的,用品体的数值与特定计量单位体现的数据。持续变量:表达在变量范围内可抽出某一范围的所有值,变量之间是持续,无限的,可以有任何小数出现。非持续变量:表达在变量数列中仅能获得固定数值,并且一般是整数。定性变量:也称为分类变量,名义变量,其变量值是定性的,表达某个体属于几种互不相容的类型中的一种。数量性状是指可以以计数和测量或度量的方式表达其特性的性状。观测测定数量性状而获得的数据就是数量性状资料。数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。计数资料指用计数方式获得的数量性状资料。该类资料也称为非持续变量资料或间断变量资料或离散变量资料。计量资料指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。其数据是用长度、重量、容积、温度、浓度等来表达,要带单位。两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定,计量资料也称为持续变量资料。质量性状资料:质量性状是指能观测到而不能直接测量的性状。观测质量性状而获得的数据就是质量性状资料,也称为属性性状资料。此类性状自身不能直接用数值表达,要获得此类性状的数据资料,须对其观测成果作数量化处理,其措施有如下两种:记录次数法;评分法资料搜集的措施:调查;试验。调查是对已经存在的事情的资料按某种方案进行搜集的措施。资料的调查又可以分为两种:普查和抽样调查。普查是对研究对象的所有个体逐一进行调查的措施。抽样调查是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的措施。试验是对已经有的或没有的事物加以处理的措施。试验设计须遵照的三大原则是:随机、反复和局部控制。常见的试验设计措施有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等。检查和查对原始资料的目的:保证原始资料的完整性和对的性。计量资料的整顿一般采用组距式分组发全距→组数→组距→组限→归组→制表全距:样本数据资料中最大观测值与最小观测值之间的差值。R=Xmax-Xmin组数:是根据观测值的多少及组距的大小来确定的。组距:组距=全距/组数组限:是指每个组变量值的起止界线。包括上限和下限。组中值:是指每个组变量值的起止界线。第一组的组中值最佳靠近于资料的最小值。临界值就高不就低。分组是计数的措施:卡片法和唱票法(画正字法和画川字法。)。变量的分布具有两种明显的基本特性:集中性和离散性。集中性:是变量在趋势上有着向某一中心汇集,或者说以某一数值为中心而分布的性质。离散性:是变量有着离中分散变异的性质。表达集中性的特性数:平均数(算术平均数,中位数,众数,集合平均数,调和平均数)表达离散性的特性数:极差,方差,原则差,变异系数算术平均数总体或样本资料中所有观测数的总和除以观测数的个数所得的商,简称平均数、均数或均值。总体:样本:中位数Md资料中所有观测数依大小次序排列,居于中间位置的观测数称为中位数或中数。当观测值个数n为奇数时,(n+1)/2位置的观测值,即Md=x(n+1)/2为中位数当观测值个数为偶数时,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数众数M0资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。注意:(1)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以上的众数;(3)重要用来描述频率分布。④极差:是数据分布的两端变异的最大范围,即样本变量值最大值和最小值之差,用R表达。一定程度上阐明样本波动幅度,但只受两个极端值大小的影响,不能反应样本中各个观测值的变异程度.…离均差:各个观测值与平均数的离差。离均差可以反应出一种观测值偏离平均数的性质和程度。平方和(SS)估计量必须符合一种特性:无偏性算术平均数的重要性质离均差之和等于零。离均差平方和最小。16.自由度:指当以样本的记录量来估计总体的参数时,样本中可以自由变动的变量的个数。自由度=样本个数-样本数据受约束条件的个数df=n-k17.方差:刻画了随机变量的取值对于其数学期望的离散程度方差越大,离散程度越大样本:总体:18:原则差样本:总体:原则差特性原则差的大小,受多种观测数影响,假如观测数与观测数间差异较大,则离均差也大,因而原则差也大,反之则小各观测数加上或减去一种常数,其原则差不变;各观测数乘以或除以一种常数a(不为0),其原则差扩大或缩小a倍。原则差作用表达变量分布的离散程度。可以概括估计出变量的次数分布及各类观测数在总体中所占的比例。估计平均数的原则误。进行平均数的区间估计和变异系数计算。变异系数定义:样本的原则差除以样本平均数,所得到的比值就是变异系数。CV=s/x×100%特点:是样本变量的相对变异量,不带单位。可以比较不一样样本相对变异程度的大小。自我测验资料按生物的性状特性可分为______和______。直方图合用于表达______资料的次数分布。变量的分布具有两个明显基本特性,即______和_______。反应变量集中性的特性数是_______,反应变量离散性的特性数是______.样本原则差的计算公式s=_________计数资料也称持续性变量资料,计量资料也称非持续性变量资料。资料中出现最多的那个观测值或最多一组的中点值,称为众数。变异系数是样本变量的绝对变异量下面变量中属于非持续性变量的是_____A.身高B.体重C.血型D.血压对某鱼塘不一样年龄鱼的尾数进行记录分析时,可作成_____图来表达。条形B.直方C.多边形D.折线第三章事件必然事件(U):一定条件下必然出现。不也许事件(V):一定条件下必然不出现。随机事件(A):一定条件下也许出现。频率设事件A在n次反复试验中发生了m次,其比值m/n称为事件A发生的频率,记为:W(A)=m/n。概率事件A在n次反复试验中,发生了m次,当试验次数n不停增大时,事件A发生的频率W(A)就越来越靠近某一确定值p,于是定义p为事件A发生的概率(probability),记为P(A)=p=大数定律:概率论中用来论述大量随机现象平均成果稳定性的一系列定律的总称。样本容量越大,样本记录数与总体参数之差越小。简朴的概率计算。第四章记录推断:把试验的表面效应与误差大小相比较并由表面效应也许属误差的概率而作出推论的措施。由一种样本或一系列样本所得的成果来推断总体的特性。记录推断的任务:分析误差产生的原因确定差异的性质排除误差干扰对总体特性做出对的判断3假设检查又叫明显性检查,是根据总体的理论分布和小概率原理,对未知或不完全懂得的总体提出两种彼此对立的假设,然后由样本的实际成果,通过一定的计算,作出在一定概率意义上应当接受的那种假设的推断。小概率原理概率很小的事件在一次抽样试验中实际是几乎不也许发生的。假设检查的环节:分析问题→提出假设→确定明显水平→计算检查记录量→做出推断双尾检查与单尾检查成组数据:将试验单位完全随机分为两组,再随机各实行一处理,这样得到的数据称为成组数据,以组的平均数作为比较的原则。成组数据平均数比较的假设检查和配对数据平均数比较的假设检查都是检查两个样本平均数和。所属总体平均数和与否相等的检查措施。成组数据两个样本抽自不一样总体,两个样本之间的变量没有任何关联。这样,不管两样本的容量与否相似,所得数据皆为成组数据。将性质相似的两个样本(供试单位)配成对,每一对除随机地予以不一样处理外,其他试验条件应尽量一致,以检查处理的效果,所得的观测值称为成对数据。点估计:以样本记录量直接估计总体的对应参数。估计总体参数的记录量称为估计量一般来说,一种好的估计量应满足如下三个条件:无偏性、有效性和相容性。区间估计按一定的概率估计总体参数在哪个范围。详细区间估计与点估计看书和ppt。第五章所谓2卡方,是指互相独立的多种正态离差平方值的总和,O为观测次数,E为理论次数,i=1,…,k为计数资料的分组数,自由度为df=k-1,依分组数及其互相独立的程度决定。2.独立性测验是测验两个变数之间是互相独立还是彼此有关的记录措施,是次数资料的一种有关研究。独立性检查:测验实际成果与理论比例与否符合;测验产品质量与否合格;测验试验成果与否符合某一理论分布。应用卡方进行独立性测验的无效假设是:H0:两个变数互相独立,对HA:两个变数彼此有关。计算过程:(1)将所得次数资料按两个变数作两向分组,排列成相依表;(2)根据两个变数互相独立的假设,算出每一组格的理论次数;(3)由(基本公式)或者变形公式算得卡方值。(4)这个x2的自由度随两个变数各自的分组数而不一样,设横行分r组,纵行分c组,则df=(r-1)(c-1)。当观测的时,便接受H0,即两个变数互相独立;当观测的Oi-Ei-0.5)2Oi-Ei-0.5)2c2=Eic(根据以上判断写记录结论。(第五章ppt28)2×2列联表的x2(卡方)独立性测验2×2表的一般形式:

成果1

成果2合计处理1

处理2

O11

O12

O21

O22R1

R2合计

C1

C2Tdf=(2-1)(2-1)=1(1)基本公式,需持续矫正(ppt30页补充)变形公式二、2×C表的独立性测验2×C表是指横行分为两组,纵行分为C≥3组的相依表资料。在作独立性测验时,其=(2-1)(c-1)=c-1。由于c≥3,故不需作持续性矫正。第六章1.试验原因:试验中所研究的影响试验指标的原因或原因组合2.原因水平:每个试验原因的不一样状态(处理的某种特定状态或数量上的差异)简称为水平。3.试验处理对受试对象予以的某种外部干预或措施,是试验实行因子水平的一种组合单原因处理处理多原因处理试验单位:在试验中能接受不一样试验处理的独立的试验载体。实际上就是根据研究目的而确定的观测总体。反复:在试验中,将一种处理实行在两个或两个以上的试验单位上。处理实行的试验单位数即为处理的反复数。第七章1.抽样需遵照的总的原则是:样本必须来自于所研究的总体样本必须能代表所研究的总体抽样措施必须与抽样目的相一致2.试验、调查的目的不一样,试验、调查的措施不一样、抽样的措施也不一样随机抽样简朴随机抽样整群抽样分层抽样双重抽样次序抽样经典抽样3.(一)随机抽样法总体比较整洁、变异程度小、群体分布均匀,可用随机抽样法随机抽样法的原则是:总体内每一种体(数据)均有同等的机会进入样本样本中每一种体(数据)进入任何一种组的机会也是相等的随机抽样法可以完全排除个人的主观性随机抽样法是最简朴、最常用的抽样措施4.随机抽样法有如下几种措施:抓阄法随机数字法伪随机数字法通过随机抽样法得到样本后,一般需计算样本的特性数,用以估计总体参数。几乎所有调查和试验都可以采用随机抽样法进行抽样。5.整群抽样和多层次抽样法从总体中抽取数个样本单位群,对单位群内的所有个体作全面调查,或用整个单位群进行试验样本单位群的抽取既可以用随机抽样法得到,也可以有选择地获得5.在整群抽样的基础上,对抽得的样本单位群不作全面调查,或不是整

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论