生物统计学(自理重点_第1页
生物统计学(自理重点_第2页
生物统计学(自理重点_第3页
生物统计学(自理重点_第4页
生物统计学(自理重点_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、生物统计学复习资料(70%)填空:10题1=10 选择:5题1=5 名词解释:5题2=10判断:5题1=5 简答:3题5=15 统计推断:4题 10+10+10+20=50第1章 绪论生物统计学:是研究收集、整理、分析和解释生物科学试验数据的科学,是统计学原理在生物学研究领域的应用。生物统计学的主要内容生物统计学包括试验数据的获取、整理和分析等相关内容,具体来说,包括试验或调查设计、数据的整理(描述统计学)、概率论基础(统计理论基础)、统计推断方法(推断统计学)等内容。调查设计:是指整个调查计划的制订,包括调查研究的目的、对象与范围,调查项目及调查表内容,抽样方法的选取,抽样单位和抽样数量的确

2、定,数据处理方法,调查组织工作,调查报告撰写等内容。试验设计:是指试验单位的选取、生物学重复数的确定及试验单位的分组等。生物统计学发展简史(1) 古典记录统计学(2) 近代描述统计学(3) 近代推断统计学总体:是研究对象的全体。个体:是总体中的一个研究单位。样本:是从总体中抽取的用于代表总体的一部分个体。样本容量记为n,通常把n30的样本称为小样本,n30的样本称为大样本。(判断区别)随机抽样:是指总体中的每一个个体都有同等的被抽取的机会组成样本。参数:由总体计算的特征数。统计数:由样本计算的特征数。准确性:也叫准确度,是指在试验中某一试验指标的观测值与其真值接近的程度。精确性:也叫精确度,是

3、指同一试验指标的重复观测值彼此接近的程度。随机误差:是由于无法控制的内在和外在的偶然因素所造成的,是客观存在的,在实验中,即使十分小心也难以消除。系统误差:也叫片面误差,是由试验材料的初始条件不同或测量仪器不准等引起的倾向性或定向性偏差。(小题)误差怎么控制?(小题)随机误差可完全避免 ()(小题)减小统计误差的方法是 (B)A、 提高准确度 B、提高精确度 C、减少样本容量 D、增加样本容量第2章 数据的描述与分析数据可以大致分为数量性状数据和质量性状数据两大类。数量性状数据:是指通过测量、度量或计数取得的数据。根据数据的特征又分为连续型数据和离散型数据。连续型数据:或称为计量数据,是指用测

4、量或度量方式得到的数量性状数据。(如身高、作物产量、蛋白质含量等)连续型数据的特点:(1) 用测量或度量方式得到的数量性状数据。(2) 数据是用长度、容积、重量等来表示。(3) 观测值可以是整数或带小数的任何数值。(4) 小数位数由测量工具或统计要求的精度而定,数据之间的变异是连续的。离散型数据:或称为计数数据,是指用计数方法得到的数量性状数据。(如不同血型的人数、鱼的数量、白细胞数等)质量性状数据:或称为属性数据,是指对某种现象进行观察而不能测量的数据。(如土壤的颜色、植物叶的形状等)质量性状数据数量化的方法(1)二值化(2)等级化离散型数据基本上采用单项式分组法整理。连续型数据一般采用组距

5、式分组法整理。全距又称为极差统计表的结构:统计表由标题、横标目、纵标目、线条、数字及合计(总计)构成。编制统计表的总原则:结构简单、层次分明、内容安排合理、重点突出、数据准确,便于理解和统计分析。统计表编制的具体要求(1) 标题:标题要简明扼要、准确地说明表的内容,有时需在最右侧注明时间、地点,表中数据为同一单位时也在此说明。(2) 标目:标目分为横标目和纵标目两项。横标目列在表的左侧,纵标目列在表的上端,并注明计量单位,如%、kg、cm等。(3) 数字:一律用阿拉伯数字,小数点对齐,(每列)小数位数一致,无数字的用“”表示,数字是“0”的,则填写“0”。(4) 线条:表的上、下两条边线略粗,

6、纵、横标目间及合计(总计)用细线分开,表的左右边线可省去,表的左上角一般不用斜线;科技论文则习惯使用三线表。常用的统计图有:柱状图、饼图、线图、直方图和折线图。离散型数据常用的统计图:柱状图、线图或饼图连续型数据常用的统计图:直方图和折线图统计图绘制的的基本要求:(1) 标题简明扼要,列于图的下方;纵、横两轴应有刻度,注明单位。(2) 横轴由左至右、纵轴由下而上,数值由小到大;图形宽度与高度之比为4:3至6:5。(3) 图中用不同颜色或线条代表不同事物时,应有图例说明。变量分布具有两种明显的基本特征,及集中性和离散性。集中性:是指变量有向某一中心聚集的趋势,或者说以某一数值中心向两侧递减分布的

7、性质。离散性:是指变量有离中心分散变异的性质。反映数据集中性的特征数为平均数,常用的是算术平均数,还包括几何平均数、调和平均数、中位数和众数等。(具体事例,如进行。的滴定叫做什么平均数)中位数:将资料中的所有观测值按从大到小的顺序排列,位于中间的那个观测值称为中位数。变异数包括极差、方差、标准差和变异系数等。(各自的计算方法):极差:资料中观测值的最大值与最小值之差,记为R。R=maxx1,x2,,xn- minx1,x2,xn方差:记为s2或均方,记为MS。(自由度为n-1)s2=(x-x)2n-1相应的总体参数称为总体方差,记为2。2=(x-)N2标准差:记为s。s=x-x2n-1=x2-

8、x2nn-1标准差的特性(1) 标准差受所有观测值的影响,观测值间的差异大小直接影响标准差的大小。(2) 在计算标准差时,所有观测值同时加上一个常数,标准差值不变;所有观测值同时乘以常数a时,标准差扩大a倍。(3) 数据呈正态分布时,在平均数两侧1s范围内的观测值个数为68.26%,在平均数两侧2s范围内的观测值个数为95.45%,在平均数两侧3s范围内的观测值个数为99.73%。标准差的作用(1) 表示变量变异程度的大小。标准差小,说明变量比较密集地分布于平均数附近;标准差大,说明变量分布比较分散。因此,可以根据标准差的大小判断平均数的代表性。(2) 利用标准差估计变量的次数分布及各类观测值

9、在总体中所占的比例。(3) 利用样本标准差代替总体标准差计算平均数的标准误。(4) 用于平均数的区间估计和变异系数的计算。变异系数的用途(1) 比较度量衡的单位不同的多组数据的变异度。(2) 比较均数相差悬殊的多组数据的变异度。计算:在度量单位不同和(或)平均数差异较大时,比较两个样本的变异程度就不能直接采用标准差,而须先对其进行标准化,消除度量单位的差异和平均数大小的差异的影响。标准差与平均数的比值称为变异系数,记为Cv。Cv=sx第3章 概率与概率分布必然事件:在一定条件下必然发生的事件,用U表示。不可能事件:在一定条件下不可能发生的事件,用V表示。概率:用于反映事件发生的可能性大小的数量

10、指标。随机事件满足以下三个条件:(1) 试验的所有可能结果只有有限个。(2) 试验的各种结果出现的可能性相等。(3) 试验的所有可能结果两两互不相容。事件的相互关系(1) 和事件,记作AB(或A+B)(2) 积事件,记作AB(或AB)(3) 互斥事件(4) 独立事件概率计算法则:(应用,p20)(1) 加法定理P(AB)=P(A)+P(B)(2) 条件概率,记作P(B|A)P(B|A)=P(AB)P(A)(3) 乘法法则设事件A和事件B是同一个样本空间的两个事件,则P(AB)=P(A)P(B|A)如果事件A与事件B相互独立,则P(B|A)=P(B),于是P(AB)=P(A)P(B)二项分布:二

11、项分布:是一种常见的离散性随机变量的概率分布。所谓二项,是指每次试验只有两个可能的结果:事件A和事件A,它们互为对立事件。(非此即彼的对立事件)二项分布的概率函数:Px=Cnxpxqn-xx=0,1,2,n (3-16)二项分布的表示方法:B(n,p)二项分布曲线形状由n(正整数)和p(0与1之间的任何数值)两个参数决定。当p趋于0.5时,二项分布趋于对称;当p值较小(p0.3)且n不大时,分布是左偏的;当p值较大(p0.7)且n不大时,分布是右偏的。后两种情况下,当n时,二项分布接近连续型的正态分布。泊松分布:事件类型:稀有事件的概率分布。表示方法:P()性质:当n时,泊松分布近似服从正态分

12、布N(,)。(了解,p24)正态分布:事件类型:连续型随机变量的概率分布表示方法:N(,2)特征(了解,p26)标准正态分布表示方法:N(0,1)普通正态分布转化为标准正态分布的方法:u=x-u【例3.6】 已知uN(0,1),试求下列概率:(记答案)(1) P(u-1)= 0.1587(2) P(|u|2.576)= 0.99(3) P(|u|1.960)= 0.05(4) P(-3u3)= 0.9972P(-1.960u1.960)= 0.95 P(|u|1.960)= 1-0.95 = 0.05P(-2.576u2.576)= 0.99 P(|u|2.576)= 1-0.99 = 0.0

13、1(记)无偏估计:统计学上,如果样本统计数分布的平均值与总体的相应参数相等,则称该统计数为总体相应参数的无偏估计值。无偏估计的三个推断:(1) 样本平均数x是总体平均数的无偏估计值;(2) 样本方差s2是总体方差2的无偏估计值;(3) 样本标准差s不是总体标准差的无偏估计值。大数定律:是概率论描述当前试验次数很大时所呈现的概率性质的定律。中心极限定理:是概率论中讨论随机变量的和的分布趋向正态分布的定理。计算:x=,x=n (3-28)u=x-x=x-n (3-29) sx=sn (3-30)t=x-sx=x-nsn (3-31)(样本方差之比)F=s12s22 (3-38)第4章 统计推断假设

14、检验:又称显著性检验,是利用样本统计数推断总体参数的统计方法。小概率原理:小概率事件在一次试验中不应该发生。假设检验的基本思路:根据零假设计算出事件发生的概率,如果概率很小,事件在一次试验中是不应该发生的,如果发生了,则认为零假设不成立。假设检验的步骤:(1) 提出零假设H0和备择假设HA;(2) 确定检验的显著水平(3) 在H0正确的前提下,根据抽样分布的统计量进行假设检验的概率计算;(4) 计算统计量对应的概率值与显著水平比较,或统计量与显著水平的临界值比较,进行差异显著性推断。双尾检验与单尾检验判别双尾检验:H0:=0 HA:0 单尾检验:H0:0 HA:0假设检验中的两类错误(区别和联

15、系):若H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,称为第类错误。若H0不是真实的,假设检验却接受了H0,就犯了接受不真实假设的错误,称为第类错误。两类错误的关系是,在样本容量相同的情况下,减少犯第类错误的概率,就会增加犯第类错误的概率;反之,减少犯第类错误的概率,就会增加犯第类错误的概率。平均数的检验(u检验,单样本/双样本,统计推断,10分,t检验,成组/配对,10分)看例题(1)112、22已知u=x1-x2x1-x2 x1-x2=12n1+22n2(2)12、22未知 n130,n230 u=x1-x2Sx1-x2 Sx1-x2=s12n1+s22n2 n130,n

16、230(t检验) t检验 成组 12=22 Se2=S12n1-1+S22n2-1n1-1+n2-1 1222 n1=n2=n Se2Sx1-x2tdf=n-1 n1n2 配对 t=x-Sx=dSd Sd=Sn参数估计包括区间估计和点估计。P(x-uxx+ux)= 1- (4-18)当总体方差2为已知,或总体方差2未知但为大样本时,置性度为P=1- 的总体平均数的区间估计和点估计分别为x-ux,x+ux,xux (4-19)当总体方差未知且样本为小样本时,由样本方差s2来估计总体方差2,置性度为P=1- 的总体平均数的区间估计和点估计分别为x-tsx,x+tsx,xtsx (4-20)第5章

17、次数资料的x2检验(统计推断,独立性或二项分布的适合性检验,10分)X2检验与连续型资料假设检验的区别(必考)X2检验连续型资料假设检验数据资料离散型资料连续型资料总体总体分布是未知的正态分布检验对象不是对总体参数的检验,而是对总体分布的假设检验对总体参数或几个总体参数之差X2检验的三个用途:(1) 单个样本方差的同质性检验(2) 独立性检验(3) 适合性检验计算公式(5-1)-(5-3):x2=O-E2EXc2=|0-E|-0.52EEij=RiCjT =1,2,j=1,2第6章 方差分析(统计推断,多重比较,LSD法,一定有显著性,20分)试验因素:试验中人为设置的影响试验指标的因素。试验

18、水平:试验因素所处的某种特定状态或数量等级。效应:对试验单位施加试验处理而引起的试验指标的改变,同一因素不同水平表现出来的单独作用称为主效应,或称简单效应。互作:多因素试验中,两个及以上因素间相互促进或相互抑制所产生的新效应,即不能用各因素主效应解释的试验指标的改变部分,称为交互作用,简称互作。方差分析的基本思路:方差分析就是通过将数据的总变异分解为组间变异和组内变异,然后比较、检验组间变异相对于组内变异的悬殊程度。通常用方差s2描述数据的变异性,方差比衡量两者的悬殊程度,且由于两个方差之比服从F分布,故可用F检验法检验组间变异和组内变异的比值是否显著。计算:最小显著差数法(LSD法)(方差分析表,4分、结果一张表)步骤:表6-2 方差分析表的一般形式 C=T2/nk方差分析的三个基本假定:效应可加性、误差正态性、方差同质性方差分析的数据转换:对数转换、反正弦转换、平方根转换估计缺失数据的原则:补上缺失数据后误差平方和最小。第8章 抽样的原理

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论