二资料整理与特征数计算_第1页
二资料整理与特征数计算_第2页
二资料整理与特征数计算_第3页
二资料整理与特征数计算_第4页
二资料整理与特征数计算_第5页
已阅读5页,还剩70页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、试验资料的整理特征数的与第二章1在生物学试验及调查中,通过对某种具体事物或现象观察获得的结果称为资料。原始数据无序有序统计分析资料整理揭示事物本质2第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理3对试验资料进行分类是统计归纳的基础。数量性状资料质量性状资料(属性性状资料)计数资料(非连续变量资料)计量资料(连续变量资料)变量定量变量定性变量连续变量非连续变量资料4 数量性状(quantitative character)是指能够以计数和测量或度量的方式表示其特征的性状。观察测定数量性状而获得的数据就是数量性状资料 (data of quantitative

2、characteristics)。数量性状资料的获得有计数和测量两种方式,因而数量性状资料又分为计数资料和计量资料两种。一、数量性状资料5 1、计数资料 指用计数方式获得的数量性状资料。 各个观察值只能以整数表示,在两个相邻整数间不得有任何带小数的数值出现,各观察值是不连续的. 该类资料也称为非连续变量资料或间断变量资料或离散变量资料。6 2、计量资料 指用测量或度量法获得的数量性状资料,即用度、量、衡等计量工具直接测定获得的数据资料。 其数据是用长度、重量、容积、温度、浓度等来表示,要带单位。两个相邻的整数间可以有带小数的任何数值出现,其小数位数的多少由度量工具的精确度而定, 计量资料也称为

3、连续变量资料。7 二、质量性状资料 质量性状(qualitative character)是指能观察到而不能直接测量的性状。观察质量性状而获得的数据就是质量性状资料(data of qualitative characteristics),也称为属性性状资料。这类性状本身不能直接用数值表示,要获得这类性状的数据资料,须对其观察结果作数量化处理,其方法有以下两种:8 1、统计次数法 在一定的总体或样本中,根据某一质量性状的类别统计其次数,以次数作为质量性状的数据。例如,在研究豌豆的花色遗传时,红花与白花杂交,子二代中红花、紫花和白花的株数分类统计如下表。这种由质量性状数量化得来的资料又叫次数资料

4、。9 2、评分法 对某一质量性状分成不同级别,对不同级别进行评分来表示其性状差异的方法。从而将质量性状进行数量化,以便统计分析。例如,试剂pH值由酸到碱分成14个等级,取待测试剂滴在pH试纸上,与pH标准色版对比,由红到紫分别定义为 114 的数值。10 两种不同类型的资料相互间是有区别的,但有时可根据研究的目的和统计方法的要求将一种类型资料转化成另一种类型的资料。 例如,兽医临床化验动物的白细胞总数得到的资料属于计数资料,根据化验的目的,可按白细胞总数过高、正常或过低分为三组,清点各组的次数,计数资料就转化为质量性状次数资料。11第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜

5、集三、试验资料的整理12调 查试 验资料搜集的方法13一、调查 调查是对已经存在的事情的资料按某种方案进行收集的方法。如地质调查、水样调查、河南省内的昆虫调查等等。 资料的调查又可以分为两种:普查和抽样调查。1、普查 是对研究对象的全部个体逐一进行调查的方法。2、抽样调查 是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。14二、试验 试验是对已有的或没有的事物加以处理的方法。 采用合理的试验设计能够以较少的投入获得较大的收获,起到“事半功倍”的效果。常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。 试验设

6、计须遵循的三大原则是:随机、重复和局部控制。15第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理16三、试验资料的整理(一)原始资料的检查与核对调查试验原始数据核对:数据本身是否有错误检查:取样是否有差错订正:不合理数据的订正17检查和核对原始资料的目的:确保原始资料的完整性和正确性。完整性:是指原始资料无遗缺或重复。正确性:是指原始资料的测量和记载无差错或未进行不合理的归并。检查中要特别注意特大、特小和异常数据(可结合专业知识作出判断)。对于有重复、异常或遗漏的资料 ,应予以删除或补齐 ;对有错误、相互矛盾的资料应进行更正,必要时进行复查或重新试验。18不必

7、分组,直接进行统计分析小样本n500 15 30表2-5样本容量与分组数的关系组距的确定即每组内的上下限范围。组距全距/组数48104.810组5cm28(3)确定组限(class limit)和组中值(class midvalue)组限 是指每个组变量值的起止界限。上限下限组中值 是两个组限的中间值。组中值下限上限 2组距2下限组距2上限第一组的组中值最好接近于资料的最小值29表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46

8、 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58

9、 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63最小一组的下限必须小于资料中的最小值,最大一组的上限必须大于资料中的最大值;组限可取到10分位或5分位上;临界值就高不就低。35,40,45,85。30(4) 分组确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。计数的方法卡片法唱票法画“正”字画“ ”31 组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40

10、 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.7800 65 67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000表2-6 150尾鲢鱼体长的次数分布表32三、试验资料的整理(三)次数分布图和频率分布图定义:把次数(频率)分布资料

11、画成统计图形。特点:直观、形象包括:条形图、饼图、直方图、多边形图和散点图33三、试验资料的整理统计图绘制的基本要求:(1)标题简明扼要,列于图的下方;(2)纵、横两轴应有刻度,注明单位;(3)横轴由左至右,纵轴由下而上,数值由小到大;图 形长宽比例约5:4或6:5;(4)图中需用不同颜色或线条代表不同事物时,应有图 例说明。34图2.1 月产蛋数次数分布柱形图图2.2 月产蛋数频率分布柱形图条形图(bar chart), 又称柱形图计数资料特点:柱形之间要间隔一定的距离 属性资料352 饼图(pie chart)图1 来亨鸡月产蛋次数分布图计数资料属性资料36图2.3 鲢鱼体长次数分布图3

12、直方图 (histogram),又称矩形图计量资料35 40 45 50 55 60 65 70 75 80 85 90特点:各组之间没有距离 37三、试验资料的整理图2.3 鲢鱼体长次数分布图35 40 45 50 55 60 65 70 75 80 85 90组中值384 多边形图(polygon),又称折线图(broken-line chart)计量资料图2.3 鲢鱼体长次数分布图395 散点图(scatter) 1 2 3 4 5 64321 1 2 3 4 5 64321 1 2 3 4 5 64321a. 正向直线关系b. 负向直线关系c. 曲线关系40表 几种动物性食品的营养成分

13、例:牛奶牛肉鸡蛋咸带鱼41搜集、归纳原始数据用表格、图形来表达数据用量化的统计学指标来描述一组定量数据的分布特征42图2.1 月产蛋数次数分布柱形图图2.3 鲢鱼体长次数分布直方图35 40 45 50 55 60 65 70 75 80 85 90集中离散43第二节 试验资料特征数的计算集中性 是变量在趋势上有着向某一中心聚集,或者说 以某一数值为中心而分布的性质。离散性 是变量有着离中分散变异的性质。变量的分布具有两种明显的基本特征:集中性和离散性。44集中性离散性平均数变异数算术平均数中位数众数几何平均数极差方差标准差变异系数调和平均数特征数45一、平均数平均数是统计学中最常用的统计量,

14、是计量资料的代表值,表示资料中观测数的中心位置,并且可作为资料的代表与另一组相比较,以确定二者的差异情况。46一、平均数(一)平均数的种类算术平均数中位数众数几何平均数调和平均数47一、平均数1. 算术平均数 (arithmetic mean)定义:总体或样本资料中所有观测数的总和除以观测数 的个数所得的商,简称平均数、均数或均值。总体:样本:48一、平均数2. 中位数(median) 资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。Md 中位数将该组数值分为两半,理论上有50的变量小于md,有50的变量值大于 md,故又称百分之五十位数,记为P50。49 1、当观测值个

15、数n为奇数时,(n+1)/2位置的观测值,即x(n+1)/2为中位数: Md = 2、当观测值个数为偶 数 时,n/2和(n/2+1)位置的两个观测值之和的1/2为中位数,即: 50一、平均数3. 众数(mode) 资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。M0注意:(1)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以上的众数;(3)主要用来描述频率分布。51一、平均数(二)算术平均数的计算方法直接计算法减去常数法加权平均法52一、平均数(三)算术平均数的重要性质算术平均数与样本内的每个值都相关,它的大小受每个值的影响;若每个Xi都乘以相同的

16、数k,则原平均数亦应乘以k;若每个Xi都加上相同的数a,则原平均数亦可直接加上a。离均差之和等于零。离均差平方和最小。53一、平均数(四)算术平均数的作用(1)指出一组数据资料内变量的中心位置,标志着资 料所代表性状的数量水平和质量水平。(2)作为样本或资料的代表数与其他资料进行比较。54 集中趋势是数据分布的一个重要特征,但单有集中趋势还不能很好地描述数据的分布规律。 仅用平均数对一个资料的特征作统计描述是不全面的,还需要引入一个表示资料中观测值变异程度大小的统计量。变异性指标55二、变异数变异数的种类极差方差标准差变异系数56二、变异数(一)极差(全距,range) 极差是数据分布的两端变

17、异的最大范围,即样本变量值最大值和最小值之差,用R表示。它是资料中各观测值变异程度大小的最简便的统计量。例:150尾鲢鱼体长 R=85-37=48(cm)R = maxx1,x2, xn - minx1,x2, xn =x1,x2, xnmax - x1,x2, xnmin57二、变异数三组同年龄、同性别儿童体重(kg)的数据:I组: 26 28 30 32 34 8II组: 20 25 30 35 40 20III组: 23 27 30 33 37 14例:极 差一定程度上说明样本波动幅度,但只受两个极端值大小的影响,不能反映样本中各个观测值的变异程度.58二、变异数如何准确地表示样本内各个

18、观测值的变异程度平均数可以求出各个观测值与平均数的离差,即离均差。离均差可以反映出一个观测值偏离平均数的性质和程度。离均差之和为零。?59二、变异数平方和(SS)平方和的平均数60二、变异数自由度(degree of freedom ,df )自由度指当以样本的统计量来估计总体的参数时,样本中可以自由变动的变量的个数。自由度 = 样本个数 - 样本数据受约束条件的个数61二、变异数(二)方差(Variance)样本总体62二、变异数(三)标准差(standard deviation, Sd)样本总体63二、变异数已分组资料:64二、变异数x=411x2=18841X=6X2=76 表2-8 9

19、名男子前臂长(cm)标准差计算 前臂长 x2 x=x-45 x2 45 2025 0 0 42 1764 -3 9 44 1936 -1 1 41 1681 -4 16 47 2209 2 4 50 2500 5 25 47 2209 2 4 46 2116 1 1 49 2401 4 1665二、变异数18841 -411*41199-1S =3.0(cm)76 - 6*699-1S =3.0(cm)66例:s20-1135524 -1.7502(cm)株高x次数ffxfx27917962418021601280081324319683826492403448332492066784325221168851857225861867396总和201646135524164622067二、变异数(三)标准差(standard deviation, Sd)特性标准差的大小,受多个观测数影响,如果观测数与观测数间差异较大,则离均差也大,因而标准差也大,反之则小1各观测数加上或减去一个常数,其标准差不变;2各观测数乘以或除以一个常数a,其标准差扩大或缩小a倍。68二、变异数(三)标准差(standard deviation, Sd)3正态分布2s3s68.27%95.46%99.73%69二、变异数(三)标准差(sta

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论