生物统计学名词解释_第1页
生物统计学名词解释_第2页
生物统计学名词解释_第3页
生物统计学名词解释_第4页
生物统计学名词解释_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1. 生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科2. 参数:对总体特征的度量,常用希腊字母表示。3. 统计数: 由样本计算所得的样本特征的数值,它是描述样本特征的数量,常用英文字母表示。4. 实验误差:实验误差是实验测量值(包括直接和间接测量值)与真值(客观存在的准确值)之差。5. 随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差。6. 系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差。7. 准确性:在试验或调查中某一试验指标或性状的观测值与其真值接近

2、的程度。8. 精确性:在试验或调查中同一试验指标或性状的重复观测值彼此接近的程度。9. 全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。组中值:是指两个组限下线和上限的中间值。10. 算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的商。特性: ( 1 )样本中各观测值与平均数之差离均差的总和等于零( 2)样本中各观测值与其平均数之差平方的总和,比各观测值与任一数值离均差的平方和小,即离均差平方和最小11. 中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中位置的观测值。12. 众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。13. 方

3、差:指用样本容量n 来除离均差平方和,得到平均的平方和。14. 标准差:指方差的平方根和。15. 变异系数:指将样本标准差除以样本平均数得出的百分比。16. 概率:指某事件A 在 n 次重复试验中,发生了几次,当试验次数n 不断增大时,事件A 发生的频率W (A)概率就越来越接近某一确定值P,于是则定P为事件A发生的概率.17. 中心极限定律:是概率论中讨论随机变量序列部分和的分布渐近于正态分布的一类定理。这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量近似服从正态分布的条件。18. 统计推断 :指从样本的统计数对总体参数做出的推断,包括参数估计和假设检验。19. 假设检验:指根据

4、总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。20. 参数估计 :指由样本结果对总体参数在一定概率水平下所作出的估计。点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X 拔不同的样本将会得到不同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足21. 小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件A 出现的概率 a 为很小,则在假设条件下的n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。22.

5、 显著水平:指在无效假设和备择假设后,要确定一个否定H0 的概率标准,这个概率称为显著水平。23. 方差同质性:就是指各个总体的方差是相同的。24. I类错误H0是真实的,假设检验却否定了它,就犯了一个否定真实假设的错误,称为a错误。25. II类错误:指如果H0不是真实的,假设检验时却接受了 H0,否定了 HA这样就犯了接受不 真实假设的错误,称为B错误。26. 标准误:描述样本平均数波动情况的统计量,就是X 拔的方差或标准差,计均数抽样误差为西格玛X拔,=西格玛/根号n,西格玛X拔就是标准误(差)27. 适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验。28. 独立性检验:指

6、研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方 法。29. 方差分析:能同时判断多组数据平均数之间的差异显著性,能把随机变异从混杂状态中分离开来,从而为判断因素对实验结果有无确实的影响提供依据30. 因素:试验中所研究的影响试验指标的因素叫试验因素。当试验中考察的因素只有一个时,称为单因素试验;若同时研究两个或两个以上因素对试验指标的影响时,则称为两因素或多因素试验。33. 水平:试验因素所处的某种特定状态或数量等级称为因素水平,简称水平。如研究3 个品种奶牛产奶量的高低,这3 个品种就是奶牛品种这个试验因素的3 个水平。32. 处理:事先设计好的实施在实验单位上的具体项目

7、就叫试验处理。33. 试验单位:在实验中能接受不同试验处理的独立的试验载体叫试验单位。一只小白鼠,一条 鱼,一定面积的小麦等都可以作为实验单位。34. 重复:在实验中,将一个处理实施在两个或两个以上的试验单位上,称为处理有重复;一处 理实施的试验单位数称为处理的重复数。35. 多重比较:多个平均数两两间的相互比较。36. 交互作用:两因素之间交互作用产生新效应的现象为交互作用37. 数据转换:在生物学研究中有时会遇到一些样本,其所来自的总体和方差分析基本假定相抵触,这些数据在进行方差分析前必须经过适当处理即数据转换来变更测量标尺。38. 回归分析:是确定两种或两种以上变数间相互依赖的定量关系的

8、一种统计分析方法。39. 相关分析是对两个或两个以上随机变量之间相互关联程度进行分析的统计学方法。40.回归系数:yA=a+bx ,自变量x改变一个单位,依变量y平均增加或减少的单位数,即回归 直线的斜率bo 41.回归截距:yA=a+bx, a是当x=0时的YA值,即直线在y轴上的截距,称为 回归截距。42. 相关系数:是指通过计算表示x 和 y 相关程度和性质的统计数。43. 决定系数:是变量x 引起 y 变异的回归平方和与y 变异总平方和的比率。44. 可直线化的非线性回归:可以用来表示双变量间的非线性关系的曲线种类很多,有些曲线类型可以通过数据转换而变形成直线形式(直线化)。 这时可将

9、转换后的数据配合成直线回归方程,然后再转换为曲线回归方程。( P139) 。45. logistic 生长曲线:开始生长缓慢,而在以后的某一范围内迅速增长,达到某限度后,增长又缓慢下来,曲线略呈拉长“S”,因此,也SU曲线。(P151)46. 相关指数:相关指数RA2表示一元多项式回归方程拟合度的高低,或者说表示一元多项式回归方程估测的可靠程度的高低。RA2=1- (E (y-y估测值)A2 + Z2平均值)A2)RA2越大,说 明模型的拟合效果越好。47. 抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后

10、利用样本特征数对总体进行推断。48. 抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,直接原因:总体中各个体之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在49. 随机抽样:抽样过程中,总体内所有个体都具有相同的被抽取的概率。50. 顺序抽样:按某种既定顺序从总体(有限总体)中抽取一定数量的个体构成样本。51. 典型抽样:根据初步资料或经验判断,有意识、有目的地选取一个典型群体作为代表(即样 本)进行调查记载,以估计整个总体。52. 简单随机抽样:指从总体N 个单位中任意抽取n 个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。53. 分层随机抽样:在抽样总

11、体中按生物个体划分为若干个层(组 ),对每层分别抽取一组随机样本,然后通过加权对总体参数做出估计。54. 整体抽样:将总体分成许多群,每个群由个体按一定方式结合而成,然后随机地抽取若干群,并由这些群中的所有个体组成样本。这种抽样法的优点是,抽样实施方便,缺点是,由于样本只有自个别几个群体,而不能均匀地分布在总体中,因而代表性差,抽样误差大。这种方法常用在工序控制中。55. 双重抽样:当简单性状与复杂性状存在关系时可用抽取简单性状来间接估计复杂性状的抽样方法。56. 调查对象:我们所要研究的总体,即根据调查目的确定的观察对象。57. 观察单位:组成调查对象的各个单位或个体。58. 实验设计:试验

12、单位的选择、分组与排列方法。59. 实验结果重演:在相同条件下,再进行试验或实践,应能重复获得与原实验结果相近的结果。60. 处理因素:对受试对象给予的某种外部干预(或措施)。61. 主效应:各试验因素的相对独立作用。63. 受试对象:62. 互作( interaction ) :某一因素在另一因素的不同水平上所产生的效应不同。 是处理因素的客体,实际上就是根据研究目的而确立的观测总体。64. 处理效应:是处理因素作用于受试对象的反应,是研究最终体现65. 误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异。68.重复:在试验中,同一处理设置的试验单位数。69. 随机:

13、是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见。70. 局部控制:根据非处理因素的变化趋势将大的试验环境分解成若干个相对一致的小环境,称为区组、窝组或重复,再在小环境内分成若干个试验单位安排不同的试验处理,在局部对非处理因素进行控制。71. 对比设计:设置一个试验组或几个试验组与许多标准区(即对照区)依次比较,在同一重复内各处理顺序排列,但不同重复排列成多排时,应注意不同重复间的相同处理不要排在一条直线上,可采用阶梯式或逆向式排列。72. 随机区组设计:亦称完全随机区组设计,特点是根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组安排一重复,区组

14、内各处理都独立的随机排列。这是随机排列设计中最常用而最基本的设计。73. 裂区设计:又称为分割试验设计,把一个或多个完全随机设计、随机区组设计或拉丁方设计结合起来的试验方法。其原理为先将受试对象作一级实验单位,再分为二级实验单位,分别施以不同的处理。74. 正交设计:是研究多因素多水平的又一种设计方法,它是根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备了“均匀分散,齐整可比”的特点,正交试验设计是分析因式设计的主要方法。是一种高效率、快速、经济的实验设计方法。75. 均积:是x 与 y 的平均的离均差的乘积和,简称均积。76. 协方差:与均积相应的总体参数。77.

15、协方差分析:把回归分析与方差分析结合。78. 试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的均匀性,使各处里处于尽可能一致的条件下。79. 统计控制:是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影响。80. 协变量:是一个独立变量(解释变量),不为实验者所操纵,但仍影响实验结果。1 .样本: 样本从总体中抽出的若干个体所构成的集合称为样本。2 .总体: 总体指具有相同性质的个体所组成的集合称为总体。3 . 连续变量:表示在不变量范围内可抽出某一范围的所有值。4 . 非连续变量: 也称为离散型变量,表示在变量数列中,仅能取得固定数值,并且通常是整数。

16、5 . 准确性 :指在调查或实验中某一试验指标或形状的观测值与真值接近的程度。6 . 精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近程度大小。7 资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始数据,对某种具体事务或现象观察的结果。8 数量性状资料:指一般是由计数和测量或度量得到的。9 质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属性资料。10 计数资料; 指由计数得到的数据。11 计量资料:有测量或度量得到的数据。12 普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。13 抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取一部分

17、个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。14 全距(极差):是指样本数据资料中最大观测值与最小观测值的差值。组中值:是指两个组限下线和上限的中间值。15 算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值的个数所得的 商。16 几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。17 标准差:指方差的平方根和。18 变异系数: 指将样本标准差除以样本平均数得出的百分比。19 概率 :指某事件A 在 n 次重复试验中,发生了几次,当试验次数n 不断增大时,事件 A 发生的频率W( A) 概率 就越来越接近某一确定值P,

18、 于是则定P 为事件 A发生的概率20 和事件: 指事件 A 和事件 B 至少有一件发生而构成的新事件称为事件A 和事件 B的事件。21 积事件:指事件A 和事件 B 同时发生而构成的新事件,称为事件A 和事件 B 的积事件。22 互斥事件:指事件A 和事件B 不能同时发生,称为事件A 和事件 B 互斥。23 对立事件:指事件A 和事件B 必有一个事件发生,但两者不能同时发生。24 独立事件:指事件A 的发生与事件B 的发生毫无关系。25. 完全事件系:指如果多个事件A1 、 A2、 、 、 、 、 An 两两相斥,且每次试验结果必然发生其一,则称事件A1 、 完全事件系A2、 、 、 、 、

19、 An 为一个完全事件系。26. 概率加法定理:指互斥事件A 和 B 的和事件的概率等于事件A 和事件 B 的概率之和, P(A+B)=P(A)+P(B) 。27. 概率乘法定理:指事件A 和事件 B 为独立事件,则事件A 与 B 同时发生的概率等于事件A 和事件 B 各自概率乘法定理的乘积,即:P(A*B)=P(A)*P(B) 。28. 伯努利大数定律:设M 是 n 次独立试验中事件A 出现的次数,而不是事件A 在每次试验中出现的概率,则对于任意小的正数£ ,有如下关系:limpm/n- p< e =129. 辛钦大数定律:是用来说明为什么可以用算术平均数来推断总体平均数m

20、的。30. 统计推断:指从样本的统计数对总体参数做出的推断。31. 假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。32. 参数估计:指由样本结果对总体参数在一定概率水平下所作出的估计。小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算出事件A 出现的概率a 为很小,则在假设条件下的n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。33. 显著水平:指在无效假设和备择假设后,要确定一个否定H0 的概率标准,这个概率称为显著水平。34.

21、方差同质性:就是指各个总体的方差是相同的。35. a错误:H0是真实的,假设检验却否定了它,就烦了一个否定真实假设的错误,称 为a错误。36. B错误:指如果 H0不是真实的,假设检验时却接受了H0,否定了 HA这样就犯了接受不真实假设的错误,称为 B错误。37. 适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检验。38. 独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是相互影响的一类统计方法。39. 相关分析:是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量间的相关关系的一种统计方法。40. 回归分析:是确定两种或

22、两种以上变数间相互依赖的定量关系的一种统计分析方法。41. 回归系数:yA=a+bx ,自变量x改变一个单位,依变量y平均增加或减少的单位数,即回归直线的斜率b。42. 回归截距:yA=a+bx , a 是当 x=0 时的 YA 值,即直线在y 轴上的截距,称为回归截距。43. 离回归平方和:它反映除去x 与 y 相关程度和性质的统计数。44. 回归平方和:它反映在y 的总体变异种由于x 与 y 的直线关系而产生y 变异减小的部分。45. 相关系数:是指通过计算表示x 和 y 相关程度和性质的统计数。46. 决定系数:是变量x 引起 y 变异的回归平方和与y 变异总平方和的比率。47. 转换:

23、指估计总体相关系数p 的置信区间时,需要将r 转换成 z。48. 试验设计:广义的指整个研究课题的设计,包括实验方案的拟订,试验方案的拟订,试验单位的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容。49. 试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复获得与原试验结果相近的结果。50. 处理因素:一般指对受试对象给予的某种外部干预。51. 主效应:多因素中试验中引起实验结果发生变化的主要。52. 互作:因素之间的交互作用。53. 受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观测总体。54. 处理效应:是处理因素作用于受试对象的反应,是研究

24、最终体现55. 误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验处理真值的差异。56. 随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与真实结果之间产生的误差。57. 系统误差: 由于试验处理以外的其他条件明显不一致所产生的带有倾向性或定向性的偏差58. 重复:在试验中,同一处理设置的试验单位数。59. 随机: 是指一个重复的某一处理或处理组合被安排在哪一个试验单位,不要有主观成见。60. 均积:是x 与 y 的平均的离均差的乘积和,简称均积。61. 协方差:与均积相应的总体参数。62. 协方差分析:把回归分析与方差分析结合。63. 试验控制:要提高试验的精确度和灵敏度

25、,必须严格控制试验条件的均匀性,使各处里处于尽可能一致的条件下。64. 统计控制:是试验控制的一种辅助手段,是用统计方法来矫正因自变量的不同而对依变量所产生的影响。第一章绪论与第二章概率论基础1 总体:指研究对象的全体,它是由研究对象中的所有单元组成的。总体中包含单元的数目称作总体容量(或大小)用N 表示。2 个体:3 样本:是指按照抽样规则所抽中的那部分单4 样本含量:样本所包含的单位数用n 表示,称为样本含量。5 随机样本:总体是唯一的、确定的,而样本是不确定的、可变的、随机的。6 参数:反映总体数量特征的综合指标称为总体参数。常见的总体参数主要有:总体总和元所组成的集合。总体均值;总体比

26、率; 总体比例等。7 统计量:反映样本数量特征的综合指标称之为统计量。统计量是n 元样本的一个实值函数,是一个随机变量,统计量的一个具体取值即为统计值。主要样本统计量有:样本总和、样本均值、样本比率、样本比例等。11 随机现象: 带有随机性、偶然性的现象.12 随机试验: 如果每次试验的可能结果不止一个, 且事先不能肯定会出现哪一个结果,这样的试验称为随机试验.13 随机事件 : 在一次试验中可能发生也可能不发生的事件称为随机事件,简称事件.14 概率的统计定义: 验后概率, 在相同条件下随机试验n次,某事件A出现m次(m<n ,则比值称为事件A发生频率。16 随机变量 : 在随机试验中

27、所得到的取值具有随机性的量,称为随机变量。17 离散型随机变量: 所有取值可以逐个一一列举18 连续型随机变量:全部可能取值不仅无穷多, 而且还不能一一列举,而是充满一个区间.19标准正态分布:仙=0,6=0的正态分布20 标准正态变量:是一个随机变量,以概率取值,它的取值服从标准正态分布。21双侧概率(两尾概率):把随机变量X落在平均数艮加减不同倍数标准差(T区间之外的概率称为两尾概率,记做 a o22 单侧概率(一尾概率):随机变量X 小于n-k er或者大于n+k(T的概率,称为一尾概率,记做a/2.23 贝努利试验:二项试验,满足下列条件:一次试验只有两个可能结果,即 “成功” 和 “

28、失败” , “成功”是指我们感兴趣的某种特征; 试验是相互独立的,并可以重复进行n 次,在 n次试验中, “成功”的次数对应一个离散型随机变量X。26 标准误:平均数抽样总体的标准差,标准误的大小反映样本平均数y 的抽样误差的大小,即精确性的高低。27 样本平均数的抽样总体:样本平均数的集合构成的一个新总体,28 中心极限定理:把和的分布收敛于正态分布这一类定理都叫做中心极限定理。第三章数据的收集与整理1 指标:用于衡量实验效果的指示性状称为实验指标,或观察项目。是一种判据。2 因素:实验中,凡对实验指标可能产生影响的原因或要素都称为因素。4 试验处理:事先设计好的实施在实验单元上的具体措施,

29、简称处理。5 试验单位:在实验中接受处理的实验载体6 重复 :在实验中,将一个处理实施在两个或两个以上的实验单位上7 处理效应:是处理因素作用于实验单位的反应,是研究结果的最终体现。8 误差:使观察值偏离处理的真实值的偶然影响。9 系统误差:在相同的条件下多次测量同一量时, 误差的绝对值和符号保持恒定;当条件改变时, 按照某一确定的规律变化的误差,是可消除的。10 随机误差:在相同条件下多次测量同一值时, 误差的绝对值和符号的变化没有确定的规律,是无法消除的。11 实验设计的三个原则:重复、随机化、局部控制 Fisher 三原则。12 完全随机设计:根据实验处理数将全部实验单元随机分成若干组,然后再按组实施不同的处理。13 随机化区组设计:把实验材料按照“组内性质完全一致”的原则分成几个组,每个组包含的材料数等于处理数,每个这样的组就成为一个“区组”,区组的个数相当于实验要求的重复数, 在每个区组内,各处理都独立随机排列。14 拉丁方设计:为了消除两个方向上土壤差异给实验带来的干扰应当设计成两个方向上的区组。15 拉丁方:由于最初构成上述方阵的各小区是用拉丁

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论