第二章试验的_第1页
第二章试验的_第2页
第二章试验的_第3页
第二章试验的_第4页
第二章试验的_第5页
已阅读5页,还剩61页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一节试验资料的整理第二节描述试验资料的特征数第二章试验资料的整理

与描述主要内容及难点试验资料的性质和整理方法;次数分布表的制作;统计表、统计图的绘制及其特点;平均数、方差、标准差及变异系数的计算方法和各自的统计意义;一、试验资料的分类1、数量性状资料

数量性状是指能够以量测或计数的方法表示其特征的性状。如作物单株产量、株高和单株光合叶面积、单株籽粒数等。观察测定数量性状而获得的数据就是数量性状资料。第一节试验资料的整理1)计量资料用称量、测量等量测手段获得的数量性状资料。因为两相邻数据间允许有带小数的任何数值出现,即两数间的变异是连续的,所以也称为连续性变异资料。2)计数资料用计数方式得到的数据资料。各观察值均为整数形式,每两数据间不允许有小数存在,即两数间的变异是不连续的,因此,也称间断性资料或不连续性变异资料。2、质量性状资料质量性状是指只能观察而不能测量的性状,如花药、茎、种子、果实、叶片的颜色、籽粒的饱满度、芒的有无等。质量性状本身不能用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理。

1)统计次数法

在一定总体或样本内,根据质量性状类别统计次数,以次数作为质量性状的数据。这种数量化的资料又叫次数资料。例如白花与红花豌豆杂交,统计F2代不同花色植株数,1000株中有红色266株,紫色494株,白色240株。例如,调查作物受某种病虫害危害情况,将作物性状分为高抗、抗、中抗、中感、感病5个级别,分别用1,2,3,4,5表示,统计样本内各种级别的植株数。2)分级赋值法先根据性状的变异情况分级,给每个分级分别赋予一个适当的数值作代表值,然后统计属于各个级别的个体数。病情指数是全面考虑发病率与严重度的综合指标。计算公式有两种:当严重度用分级代表值表示时,病情指数=100×∑(各级病叶数×各级代表值)/(调查总叶数×最高级代表值);当严重度用百分率表示时,病情指数=普遍率×严重度二、试验资料的整理根据数据出现的一定范围,从最小值到最大值划分成若干个互斥的组区间,再统计各组区间内观察值个数,则可从中寻找到一定的规律,这种由不同组区间内观察值出现的次数组成的分布,简称次数分布。1、计数资料的整理

观察值不多,变异范围不大的计数资料,以每一观察值为一组进行分组,然后统计次数制成次数分布表。表2-1、100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917表2-2、100个麦穗每穗小穗数的次数分布表

每穗小穗数(x)划线计数次数(ƒ)15╫╫│

616╫╫

╫╫

╫╫

1517╫╫

╫╫

╫╫

╫╫

╫╫

╫╫

║3218╫╫

╫╫

╫╫

╫╫

╫╫

2519╫╫

╫╫

╫╫

1720╫╫

5总次数

100表2-3、200个稻穗每穗粒数的次数分布表

每穗粒数(x)次数(ƒ)

26—301 31—353 36—4010 41—4521 46—5032 51—5541 56—6038 61—6525 66—7016 71—758 76—803 81—852

合计2002、计量资料的整理

计量资料在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值归组,制成次数分布表。下面以表2-4中140行水稻产量为例,说明计量资料整理的方法与步骤。17716121498163131183116173192215214959717618997254181231197125158129102911192391881639717583143194142181160211159123219137179145140149172197158159118801741731541871791751592451921381597515213115112217711917615116513016321519815114711917518713614912311112417119413195126108150205186179166227149136196101161149118135175141152199134141155155150184143169167116206148111131155168190124104165137168158209197169213159表2-4140行水稻产量(单位:g)(1)求全距:全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即R=Max(x)-Min(x)

此例最大观测值为254g,最小为75g,全距

R=254–75=179(g)(2)确定组数与组距:组数的确定依据:1)观察值多少,2)极差,3)计算方便,4)能保持资料真实性。表2-4中观测值个数即样本容量为n=140,查表2-5,组数为10—12,这里分为12组。样本容量组数30—605—860—1008—10100—20010—12200—50012—18500以上18—30表2-5样本容量与组数

组距:指每组的最大值与最小值之差,记为i。分组时要求各组的组距相等。组距的大小由全距和组数确定,计算公式为:组距(i)=全距/组数本例组距(i)=179/12=14.9(g)为了计算方便,以15g作为组距。(3)、确定组中值与组限:第一组的组中值一般选接近资料中的最小值为宜,而且便于计算。此例为75。(4)、数据归组。第一组的下限为:75-15/2=67.5;上限为:75+15/2=82.5;组限组中值(x)划线计数次数(ƒ)累加次数67.5—75║2282.5—90╫╫║7997.5—105╫╫║716112.5—120╫╫╫╫╫1329127.5—135╫╫╫╫╫╫║1746142.5—150╫╫╫╫╫╫╫╫2066157.5—165╫╫╫╫╫╫╫╫╫╫2591172.5—180╫╫╫╫╫╫╫╫│21112187.5—195╫╫╫╫╫13125202.5—210╫╫║║9134217.5—225╫3137232.5—240║2139247.5—255│1140合计(n)

140140表2-6、140行水稻产量数据的次数分布表3、质量性状资料的整理

对于质量性状资料可按性状或属性进行分组,分别统计各组的次数,然后制成次数分布表。例如,水稻杂种F2植株米粒性状的分离情况,见表2-7。

性状分组次数(ƒ)频率(%)

红米非糯

9654

红米糯稻

3721

白米非糯

3117

白米糯稻

158

合计

179100表2-7、水稻杂种F2植株米粒性状分离情况统计表:用表格形式表示数据间的数量关系。统计图:用几何图形表示数据间的数量关系。使用统计表和统计图,可以把研究对象的特征、内部构成、相互关系等简明、形象地表达出来,便于分析比较。三、常用统计表与统计图表2-8大豆花色一对等位基因杂种二代

分离情况统计表

花色次数(f)频率(%)紫色22173.42白色8026.58合计301100.00x(产量,g/行)图2-1、140行水稻产量次数分布直方图(histogram)x(产量,g/行)图2-2、140行水稻产量次数分布多边形图(polygon)

图2-3、水稻杂种F2米粒性状分离条形图单式条形图(bardiagram)

复式条形图

图2-4、四个水稻品种不同发育时期叶绿素含量品种复式条形图图2-5、水稻杂种F2米粒性状分离饼形图图2-6、小麦生产年降水情况单式线图图2-7、不同小麦品种灌浆结实期叶片蒸腾速率(○陕229;

长武134;△晋麦47;◆偃师9号;▲咸农151)

蒸腾速率(mmol/m2.s)复式线图第二节描述试验资料的

特征数除了用统计表和统计图来直观、形象地表示研究对象的数量特征外,统计数也可用来描述研究对象的内在规律。把这些统计数称为特征数。描述资料集中性的特征数是平均数,描述资料离散性的特征数是变异数。参数:用总体的全体观察值计算的、描述总体的特征数称为参数(parameter)。参数是一个常量,一般未知,通常用希腊字母表示,如总体平均数μ,总体方差σ2

等。统计数:由样本全体观察值计算的,描述样本的特征数称为统计数(statistics)。统计数是一个变量,随样本的不同而不同,统计数一般用拉丁字母表示,如样本平均数,样本均方等。统计上,通常由统计数去估计或推断所在总体的相应参数。总体与样本的关系图总体(随机变量)参数:μ,σ2,N样本统计数:,s2,n(次数分布图、表)数据分析(不同的假设测验)一、平均数(mean)平均数可综合反映研究对象在一定条件下的一般水平,是数量资料的代表数,常用来进行资料间的比较。1、算术平均数(arithmeticmean)1)定义与公式总体平均数:样本平均数2)平均数的基本性质:简记为(a≠x)例测某水稻单株粒重的样本5个观察值分别为3,8,7,6,4g,试计算该样本离均差之和。

x

3

8

7

6

4

-2.6

2.4

1.4

0.4

-1.66.765.761.960.162.56964493616总和=28平均=5.60

17.2174【例2·1】

在大豆区域试验中,吉农904的6个小区产量分别为25.0、26.0、22.0、21.0、24.5、23.5(kg)。求该品种的小区平均产量。

即吉农904的小区平均产量为23.5kg3)平均数的计算

直接法加权法式中,xi-各组组中值;fi-各组次数;K-分组数。各组的次数fi是权衡各组中值xi在资料中所占比重大小的数量,因此f被称为组中值xi的“权”。【例2·2】用加权法计算表2-6资料中140行水稻平均产量。即140行水稻平均产量为157.93g。采用直接法算得=157.47g,用加权法计算的结果与其十分接近。样本平均数是总体平均数的无偏估计统计上定义:当一个统计数的数学期望等于相应的总体参数时,则称该统计数为其总体参数的无偏估计。统计数的无偏性有两个含义:第一是无系统性偏差,把这些正负偏差在概率上平均起来,其值为零;第二是当统计数使用次数无限增大时,取其平均值,能无限逼近被估计的量。因此无偏估计不等于在任何时候都给出正确无误的估计。例:有一总体:1,6,4,5,6,3,8,7.则μ=∑x/N=5如从中取样本容量为3的样本,则有个样本.其中只有4个样本:数学期望是指所有样本平均数的平均值等于μ,这就是无偏估计的概念.

平均数有二个缺点:一是它易受较大值或较小值的影响;二是在有些情况下不具有实际意义。因此在反映资料的集中性或代表性时,还需要引入其他平均数的概念。

例:买100元某基金,5年净值如下,计算平均年收益率.11013010016017114.4%1101308016017119.3%2、中位数和众数中位数又称中数(median),记为Md。将观察值按大小依次排列,当观察值数目为奇数时,最中间的观察值就是中数Md;当观察值数目为偶数时,最中间的两个观察值的算术平均数为中数Md。在资料中出现次数最多的数或组中值称为众数(mode),记作M0。3、几何平均数和调和平均数

设有n个观察值,其乘积开n次方所得的值,即为几何平均数,常用Mg表示,即:几何平均数常用在生长率、生产动态及药物效价分析上。调和平均数设有n个观察值,各观察值倒数的算术平均数之倒数就称为调和平均数,用H表示,调和平均数主要求一个过程不同阶段的平均速度。调和平均数主要用于反映研究对象在不同阶段的平均速度。如土壤毛细管中水分上升速度。二、变异数变异数就是表示资料变异大小的统计数,最常见的变异数有极差、标准差、变异系数。甲200198201197204206

(meansquare),记为orMS。在计算样本方差时,是离均差的平方和除以(n-1)而不是样本容量n。把(n-1)称为自由度(degreeoffreedom),记为df或DF。自由度的概念在计算离均差平方和时,能够自由变动的离均差个数。n个离均差受到这一条件的约束,能自由变动的离均差个数是n-1,第n个离均差不能再任意变动。一般情况下,计算离均差平方和有k个约束条件,则其自由度dƒ=n-k。计算样本方差为什么要用自由度作分母?因此将比偏小。统计学已经证明:

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论