植物营养研究方法 第六章生物统计方法-1_第1页
植物营养研究方法 第六章生物统计方法-1_第2页
植物营养研究方法 第六章生物统计方法-1_第3页
植物营养研究方法 第六章生物统计方法-1_第4页
植物营养研究方法 第六章生物统计方法-1_第5页
已阅读5页,还剩34页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三章植物营养研究的生物统计方法第一节生物统计的重要性与相关概念第二节统计假设检验第三节方差分析第四节回归分析第五节相关分析第六节协方差分析重复AB110.2310.98210.2410.97310.2510.99410.2811平均数10.2510.985重复AB111602101312804146平均数11.7536.75差异不显著差异极显著一、总体与样本总体:具有共同性质的个体所组成的集团。有限总体无限总体样本:从总体中抽取部分个体所组成的集合。样本中包含的个体数目叫样本容量。为什么进行抽取本?原因:(1)总体太大;(2)破坏性取样。二、变数与观测值1.变数(variable):在数量上表现大小不同,或在质量上表现为不同类型的数据的总称。(1)数量变数:数量性状,可用数量来表达。(2)质量变数:质量性状,只能描述,不能测量。a.连续性变数b.间断性变数2.观测值(observation):每个个体的变数测量值。三、参数与统计数1.参数(parameter):由总体的所有个体概括出来的特征数。统计数是对总体参数的估计值。2.统计数(statistic):由样本的所有个体概括出来的特征数。参数一般用希腊字母表示。统计数一般用拉丁字母表示。总体和样本四平均数平均数是数据的代表值,用来表明资料中各观测值的中心位置。平均数主要包括有:算术平均数(arithmeticmean)中位数(median)众数(mode)几何平均数(geometricmean)调和平均数(harmonicmean)(一)算术平均数

算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数、均数或均值,记为。

012345678910平均数=5平均数=6123456714

算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。1、直接法主要用于未经分组资料平均数的计算。

设某一资料包含n个观测值:x1、x2、…、xn,则样本平均数可通过下式计算:简写:2、加权法式中:xi-第i组的组中值;fi-第i组的次数;k-分组数

第i组的次数fi是权衡第i组组中值xi

在资料中所占比重大小的数量,因此将fi

称为是xi

的“权”,加权法也由此而得名。

对于样本含量n≥30以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数,计算公式为:(三)算术平均数的基本性质

1、算术平均数的计算与每一个数(值)都有关。

2、如果是n1个值的平均数,是n2个值的平均数,那么全部n1+n2个值的算术平均数是

(加权平均数)

3、样本各观测值与平均数之差的和为零,即离均差之和等于零。

或简写成

4、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。(常数)或简写为:5、若A为任意常数,6、平均数是有单位的数值,与原资料单位相同。注意:必须性状同质时,才有代表性。

对于总体而言,通常用μ表示总体平均数,有限总体的平均数为:

(4.3)

式中,N表示总体所包含的个体数。当一个统计量的数学期望等于所估计的总体参数时,则称此统计量为该总体参数的无偏估计量。统计学中常用样本平均数()作为总体平均数(μ)的估计量,并已证明样本平均数是总体平均数μ的无偏估计量。五、中位数将资料内所有观测值从小到大依次排列,位于中间的那个观测值,称为中位数,记为Md。当观测值的个数是偶数时,则以中间两个观测值的平均数作为中位数。当所获得的数据资料呈偏态分布时,中位数的代表性优于算术平均数。中位数的计算方法因资料是否分组而有所不同。对于未分组资料,先将各观测值由小到大依次排列,找到中间的1个数(n为奇数)或2个数(n为偶数),之后求平均即可。0123456789100123456789101214中位数=5中位数=5

若资料已分组,编制成次数分布表,则可利用次数分布表来计算中位数,其计算公式为:

式中:L—中位数所在组的下限;

i—组距;

f—中位数所在组的次数;

n—总次数;

c—小于中数所在组的累加次数。01234567891011121314众数=9没有众数众数可能不存在可能有多个众数多用于属性数据六、众数资料中出现次数最多的那个观测值或次数最多一组的组中值,称为众数,记为M0。

七、几何平均数

n个观测值相乘之积开n次方所得的方根,称为几何平均数,记为G。其计算公式如下:

为了计算方便,可将各观测值取对数后相加除以n,得lgG,再求lgG的反对数,即得G值,即:八、调和平均数

各观测值倒数的算术平均数的倒数,称为调和平均数,记为H,即

??对于同一资料:

算术平均数、几何平均数、调和平均数存在什么关系。变异数-离散程度

用平均数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。一、极差(全距)一组数据最大值与最小值之差。特点:

(1)计算简单;

(2)意义明显,便于解释;

(3)反应不灵敏

(4)易受2端数值的影响。计算:EXCEL:MAX()-MIN()Σ|x–x|/n为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值个数n求得平均绝对离差,即Σ|x–x|/n。虽然平均绝对离差可以表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。二、平均(绝对离)差三、方差与标准差特点:(1)感应灵敏;(2)严密精确;(3)适用于代数处理;(4)受抽样变动的影响小;(5)不够简明易懂;(6)计算困难;受极端值影响较大。

计算:方差:函数VAR();标准差:STDEV()四、标准误是样本均数的抽样误差。数理统计证明,标准误的大小与标准差成正比,而与样本含量(n)的平分根成反比,即:这就是标准误的计算方法。标准差与平均数的比值称为变异系数,记为CV。变异系数是无量纲的量,可以用于不同单位、不同尺度下各样本变异程度的比较。注意:变异系数的大小,同时受平均数和标准差两个统计量的影响,因而在利用变异系数表示资料的变异程度时,最好将平均数和标准差也列出。五、变异系数数据的一些分布形式一、概率(probability)与概率分布1.概率:度量随机事件出现或发生可能性大小的尺度;(1)统计概率:通过大量数据统计得出的发生概率(2)理论概率:事件未发生之前就已预料的发生频率2.概率分布:随机变量的的取值(xi)及其相应的概率P(xi)构成。(1)离散型随机变量均值:E(x)=μ=∑xiP(xi)方差:D(x)=σ2=∑(xi-μ)2P(xi)(2)连续性随机变量均值:

方差:概率分布实际上是一种频率分布。※小概率原理:若事件A发生的概率较小(如小于0.05或0.01),则认为事件A在一次试验中不太可能发生。17世纪瑞士数学家Bernoulli(贝努力)通过实验得到的结果,用于描述不连续的简短试验,是一种有广泛用途的离散型随机变量的概率分布。

需满足的条件:

(1) 每次试验只有2个结果:成功或失败

(2) 每次试验中每个结果出现的概率不变

(3) 基本试验之间相互独立

(4) 在相同试验条件下,试验可充复进行。

二、二项分布(binomialdistribution)例如:检测一批种子的发芽情况(发芽:不发芽)概率函数为: ,q=1-p均值:方差:不同的二项分布曲线:1)p值不同的二项分布比较2)n值不同的二项分布比较Excel中常用的二项分布函数有3个:(1)BINOMDIST-用于计算二项分布的概率(2)CRITBINOM-用于计算大于等于临界值的累积二项分布概率值(3)NEGBINOMDIST-负二项分布函数,用于返回二项分布的概率BINOMDIST例如:一次抽奖,中奖的概率为10%,问抽10次,中奖

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论