版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、生物统计1、 生物统计的含义: 研究生物的数量特征及其数量规律的一门方法论学科(数理统计和概率论的原理在生物学研究中的应用)2、 生物统计学两大内容及作用1. 试验设计:主要作用是减少试验误差,获得科学准确的试验数据.2.统计分析:主要作用是发现事物数量的本质及其规律.第一章1、 何谓试验因素、试验水平、试验处理?何谓简单效应、主要效应和交互作用效应?试验因素,简称因素或因子:被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应).水平:试验因素内不同的级别或状态。试验处理:单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。
2、试验效应: 试验因素对试验指标所起的增加或减少的作用。 简单效应: 在同一因素内两种水平间试验指标的差异。 主要效应:一个因素内各简单效应的平均数。 交互作用效应,简称互作: 因素内简单效应间差异的平均。2、什么是试验方案?如何制定一个正确的试验方案? 试验方案:根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。 1. 目的明确。 2. 选择适当的因素及其水平。 3. 设置对照水平或处理,简称对照(check,符号CK)。 4. 应用唯一差异原则。3、什么是试验指标?试验指标:用于衡量试验效果的指示性状。4、什么是试验误差?试验误差与实验的准确度、精确度以及试验处理间比较的可靠性有什
3、么关系?试验误差的概念:试验结果与处理真值之间的差异.系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;系统误差是可以通过试验条件及试验过程的仔细操作而控制的。实际上一些主要的系统性偏差较易控制,而有些细微偏差则较难控制。随机误差影响了数据的精确性,精确性是指观测值间的符合程度。 随机误差是偶然性的。整个试验过程中涉及的随机波动因素愈多,试验的环节愈多,时间愈长,随机误差发生的可能性及波动程度便愈大。2、 试验误差有哪些来源?如何控制?来源:(1)试验材料固有的差异(2)试验时农事操作和管理技术的不一致所引起的差异(3)进行试验时外界条件的差异控制的方法:(1)选择同质一致
4、的试验材料(2)改进操作和管理技术,使之标准化(3)控制引起差异的外界主要因素 选择条件均匀一致的试验环境; 试验中采用适当的试验设计和科学的管理技术; 应用相应的科学统计分析方法。 3、 试验误差能否完全消除?为什么?第二章1、 田间试验设计的基本原则是什么?各有何作用?完全随机设计、随机完全区组设计、拉丁方设计各有何特点?基本原则:1.重复(replication) :估计试验误差,降低试验误差2.随机 (random):无偏估计试验误差;研究随机事件-获得随机变量-概率的性质-进行统计分析(统计推断)!3.局部控制(local control):有效地降低试验误差重复随机排列局部控制降低
5、试验误差无偏的试验误差估计设置区组的原则:同一区组内尽可能相同,不同区组间可以存在差异。完全随机设计:设计分析简便,但是应用该设计的条件是要求试验的环境因素相当均匀。随机区组设计:根据“局部控制”的原则,将试验地(或试验环境)按肥力变异梯度(或条件变异梯度)划分为 等于重复次数的区组,一区组亦即一重复,区组内各 处理都独立地随机排列。拉丁方设计:将处理从纵横二个方向排列为区组(或重复),使每个处理在每一列和每一行中出现的次数相等(通常一次),所以它是比随机区组多一个方向局部控制的随机排列的设计。优点:精确度高,缺点:缺乏伸缩性。第三章1、 总体、样本、随机样本、参数、统计数的概念和关系。总体(
6、 population ):具有共同性质的个体所组成的集团. 有限总体-由有限个个体构成的总体. 无限总体-总体所包含的个体数目有无穷多个 .样本( sample ):从总体中抽取若干个个体的集合称为样本。随机样本( random sample ):从总体中随机抽取的样本称为随机样本。参数:由总体中全部个体观察值计算得总体特征值.统计数( statistic ):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数。关系:试验研究的目的是为了获得总体的信息或特征; 试验研究的方法则是抽样研究; 利用样本的结果(统计数)推断或估计总体特征 (参数).2、平均数的意义,算术平均数的两个特性平
7、均数是数据的代表值,表示资料中观察值的中心位置(集中趋势),并且可作为资料的代表而与另一组资料相比较,借以明确二者之间相差的情况。算术平均数的特性:1) 离均差之和为零2) 离均差平方的总和最小2、 变异数的意义、种类和计算方法 变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性. 变异数的种类:1、 极差 R=最大观察值最小观察值 2、 方差 三、标准差 四、变异系数 4、数量性状资料和质量性状资料的含义数量性状资料:能用数量衡量程度的性状资料质量性状资料:不能用数量衡量程度的性状资料数量性状的度量有计数和量测两种方式,其所得变数不同。 1. 不连续性或间
8、断性变数指用计数方法获得的数据。(取值间断) 2. 连续性变数指称量、度量或测量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。(取值连续) 质量性状指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料,可采用下列两种方法:统计次数法:于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。 给分法:给予每类性状以相对数量的方法第四章1、 概率的含义和性质 概率(probability) -每一个随机事件出现的可能性称为该事件的概率。统计学上用
9、n较大时稳定的频率近似代表概率。通过大量实验而估计的概率称为实验概率或统计概率,以p表示。2、 小概率原理及其在统计假设测验中的应用如何理解小概率原理:若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)3、 正态分布曲线特性第五点 正态曲线与横轴之间的总面积等于1,因此在曲线下横轴的任何定值,例如从y=y1到y=y2之间的面积,
10、等于介于这两个定值间面积占总面积的成数,或者说等于y落于这个区间内的概率。 4、概率分布、概率函数、累计概率函数的含义概率分布:随机变量的取值与其对应概率的关系或规律称为随机变量的概率分布.这种关系可以用分布列,分布图及分布函数表示.概率函数:表示随机变量Y取y的概率的函数f(y),称为概率函数(对离散型随机变量)或概率密度函数(对连续型随机变量).累积概率函数:表示随机变量Y取小于或等于y的概率的函数F(y),称为累积概率函数.4、 正态离差、标准正态分布的含义正态离差:变数y离其平均值u以为单位转换标准化正态分布:均值为0,标准差为1的正态分布称为标准化正态分布.5、 抽样分布、单个样本平
11、均数的抽样分布和参数,两个样本平均数差数的抽样分布和参数抽样分布:从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布 如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。(1) 该抽样分布的平均数 与母总体的平均数相等。 (2) 该抽样分布的方差与母总体方差间存在如下关系:如果从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一个总体抽取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本,这两个独立随机抽取的样本平均数间差数( )的抽样分布参数与两个母总
12、体间存在如下关系:1) 抽样分布的平均数与母总体的平均数之差相等。2) 该抽样分布的方差与母总体方差间的关系为:7、二项的三种分布性质、变量取值个数和参数分布类型分布性质变量取值个数二项总体分布总体分布0和1两个P二项(次数)分布抽样分布(n+1)个nP二项成数分布抽样分布(n+1)个P第5章 (重难点)1、 什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是哪一种?为什么?统计假设(statistical hypothesis) :对样本所属的总体(特征值或参数)提出假设无效假设(null hypothesis):记作H0,假设样本所属总体效应或参数(平均数)与某一
13、指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.备择假设( alternative hypothesis ):记作HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.无效假设2、 什么是显著水平?为什么要有显著水平?根据什么确定显著水平?它和统计推断有什么关系?显著水平:用来检测假设的概率标准5%或1%等称为显著水平。要有显著水平的原因:作为衡量实验差异性的标准。如果试验中难以控制的因素较多,实验误差可能较大,则显著水平可选低些,及值取大些,反之,如果实验中难以控制的因素较多,实验误
14、差可能较小,则显著水平可选低些,即值应小点。与统计推断的关系:若算出其概率大于值,则接受Ho。若算出的概率小于值,则应否定Ho。3、 什么是统计推断?它包括哪些内容?统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数);把试验的表面效应与误差大小相比较并由表面效应可能属误差的概率而做出推论的方法称为统计推断。一是统计假设测验,二是参数的区间估计.4、 统计假设的含义方法步骤 统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 H0,备择假设HA)然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反
15、的备择假设. (1) 提出统计假设: (2) 规定测验的显著水平 值。 (3) 计算概率: 一是直接计算u值 如果 如果 二是计算出两个否定区域为: 和 如果 位于着两个否定区域,则概率 (4)推断:根据“小概率事件实际上不可能性”原理作出接受或否定无效假设的推断。5、 为什么说统计假设测验又称差异显著性测验因随机误差而得到的概率P<0.05称这个差数是显著的。若因随机误差而得到的某差数的概率P<0.01称这个差数是极显著的。所以这种假设测验也成为显著性测验。6、 区间估计、置信区间、置信度区间估计:在一定的概率保证下,有样本统计数估计总体参数所位于的区间。置信区间:在一定的概率保
16、证下,估计出一个范围或区间以能够覆盖参数u的区间。置信度:保证该区间能覆盖参数的概率P,P=1-。7、区间估计与假设测验关系如果无效假设位于置信区间内,就接受无效假设,称为差异不显著。如果无效假设位于置信区间外,就否定无效假设,接受备择假设,称为差异显著。第六章1、 方差分析的含义是什么?方差分析的基本步骤?如何进行自由度和平方和的分解?如何进行F测验和多重比较?多个处理平均数间的相互比较为什么不宜用t测验法?数据的线性模型与方差分析有何关系?方差分析:是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。是关于k(k3)个样本平均数的假设测验方法
17、. 方差分析的步骤: 1.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差. 2.F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. 3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.总平方和=组间(处理间)平方和+组内(误差)平方和总自由度 =组间自由度+组内自由度方差分析的线性可加模型:总体中的每一个变量可以按其变异的原因分解成若干个线性组成部分。它们是数据分析的重要基础,也是方差分析的理论依据。2、 方差分析有哪些基本假
18、定?为什么有些数据需经过转换才能进行方差分析?有哪几种常用转换方法?各在什么条件下应用? 3种基本假定: (1) 处理效应与环境效应等应该具有“可加性”(2) 试验误差应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即“正态性”(3) 所有试验处理必须具有共同的误差方差,即误差同质性因为数据的主要缺陷,采用相应的变数转换,使其转换后的数据的性质基本符合“三性”;然后用转换后的数据作方差分析。常用的三种转换方法: 平方根转换:样本平均数与其方差有比例关系 对数转换:数据表现的效应为非可加性,而成倍加性或可乘性,同时样本平均数与其极差或标准差成比例关系 反正弦转换:资料系成数或百分数,则它
19、将作二项分布,而已知这一分布的方差是决定于其平均数p的。所以,在理论上如果p<0.3和p>0.7皆需作反正弦转换,以获得一个比较一致的方差3、 方差分析思想思路方差分析的思想:任何事物的数量特征都是受多种因素的影响,其中起重要作用的因素所引起的变异量(方差)就大;起次要作用的因素所引起的变异量就小;不起作用的因素其变异量(方差)就不能显著大于试验误差的变异量(方差).方差分析的思路:首先把试验资料的总变异分解为各个因素(包括试验误差)的变异,并计算出它们的方差,利用误差方差对各个因素进行方差的显著性测验,最后对方差显著的因素内的各个水平的平均数进行多重比较.4、 F测验前提条件F测
20、验需具备条件:(1)变数y遵循正态分布N( , ),(2) s12 和 s22 彼此独立 。5、 多重比较含义思路方法,标记字母法如何进行?多重比较:是指多个处理平均数间的差异显著性比较或测验。 多重比较有多种方法,常用的三种: 最小显著差数法(LSD法) 复极差法( q法) Duncan氏新复极差法(SSR法)思路:利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值。 标准,则它们的总体均值就差异显著; 反之就差异不显著.标记字母法原则:凡差异显著者标记不同字母,凡差异不显著者标记相同字母.6、 如何理解区组控制(局部控制)减少试验误差? 把区组变异作为一项引起变异的因素从误差中分
21、离出来了第七章1、 卡平方用于次数资料适合性测验定义? 设某总体共分成k组,每组个体出现的概率依次为p1,p2,pK,在n次独立观察抽样中,各组个体出现的理论次数E1=np1,E2=np2,Ek=npk.而各组个体出现的实际次数则为O1,O2,Ok, 则2、 适合性测验、独立性测验的含义和方法适合性测验:测验实际次数与理论次数是否相适合的卡平方测验。(1) 提出假设(2)确定显著水平 =0.05(3)计算概率(4)推断:依所得概率值的大小,接受或否定无效假设 独立性测验:测验两个因素的列联次数是否相互独立的卡平方测验。进行独立性测验的无效假设是:H0:两个变数相互独立,对HA:两个变数彼此相关
22、。 计算过程: (1)将所得次数资料按两个变数作两向分组,排列成列联次数表; (2)根据两个变数相互独立的假设,算出每一组格的理论次数; (3)由 算得 值。第九章1、 什么叫做回归分析?直线回归方程和回归截距、回归系数的统计意义是什么?如何计算?回归分析:计算回归方程为基础的统计分析方法。为Y 依X 而变化的回归方程a回归截距:a是x=0时Y的值,即回归直线在y 轴上的截距。b 回归系数:b是x 每增加一个单位数时,Y平均地将要增加(b0时)或减少(b0时)的单位数。2、什么叫做相关分析?相关系数、决定系数各有什么具体意义?如何计算?如何对相关系数作假设测验?相关分析:计算相关系数为基础的统
23、计分析方法。计算表示Y 和X 相关密切程度的统计数,并测验其显著性。这个统计数在两个变数为直线相关时称为相关系数(即表示变量间相关性质与程度的统计数),记为r。决定系数:由x不同而引起的y的平方和U占y总平方和的比率。 H0: 的假设测验测验样本相关系数 r 来自无线性相关总体的概率,所作的假设为H0: 对HA: 0。在总体中抽样,r的分布随样本容量n的不同而不同。r的抽样误差:当时 或者2、 相关系数、决定系数的性质和区别r 的取值区间是-1,1。双变数的相关程度决定于|r|,|r|越接近于1,相关越密切;越接近于0,越可能无相关。 正的r 值表示正相关,负的r 值表示负相关。而相关系数r的正或负和回归系数b是保持一致。决定系数为非负值。决定系数越大,相关性越大。决定系数越小,相关性越小。决定系数和相关系数的区别在于: 除掉|r |=1和0的情况外,r²总是小于|r |。这就可以防止对相关系数所表示的相关程度作夸张的解释。 r 是可正可负的,而r²则一律取正值,其取值区间为0,1。因此,在相关分析由r 的正或负表示相关的性质,由r² 的大小表示相关的程度。3、 建立线性回归方程原理及其在几何
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 《聊聊品牌那些事》课件
- 《视频监控学习资料》课件
- 协调科护士工作总结
- 家居装饰行业行政后勤工作总结
- 银行行业保安工作总结
- 黑龙江省哈尔滨市平房区2023-2024学年九年级上学期期末调研测试化学试卷
- 财务工作项目落实总结
- 旅游接待员工作总结
- 温泉景区服务员工作总结
- 《清华土力学》课件
- 17J008挡土墙(重力式、衡重式、悬臂式)图示图集
- 2025年济南铁路局招聘笔试参考题库含答案解析
- 儿童涂色画空白填色图(100张文本打印版)
- 2024版合同及信息管理方案
- 压缩空气(教学设计)-2024-2025学年三年级上册科学教科版
- JGT266-2011 泡沫混凝土标准规范
- 长线法节段梁预制施工方案wgm
- ProE5.0全套教程(完整版)
- 钢筋混凝土框架结构施工工艺(附施工图)
- PLC与物料分拣系统(毕业论文)
- Adams课程设计
评论
0/150
提交评论