




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第2章数据的组织与表达ArrangementandPresentationofDataSection2.1
DataandDataType
数据与数据类型
一、原始数据的组织资料以电子表格(spreadsheet)方式记录。包括个体(Individual):一笔数据所描述的对象(object)。电子表格中输入在一行。及变量(Variable):描述任何一个个体的特征,一个变量对不同的个体取不同的数值(value)。电子表格中输入在一列。(一)数量性状资料数量性状(quantitativetrait)的度量有计数和量测两种方式,其所得变数不同。1.不连续性或间断性变数(discontinuousordiscretevariable)指用计数方法获得的数据。2.连续性变数(continuousvariable)指称量、度量或测量方法所得到的数据,其各个观察值并不限于整数,在两个数值之间可以有微量数值差异的第三个数值存在。二、试验资料的性质与分类(二)质量性状资料
质量性状(qualitativetrait)指能观察而不能量测的状即属性性状,如花药、子粒、颖壳等器官的颜色、芒的有无、绒毛的有无等。要从这类性状获得数量资料,可采用下列两种方法:统计次数法于一定总体或样本内,统计其具有某个性状的个体数目及具有不同性状的个体数目,按类别计其次数或相对次数。
2.
给分法给予每类性状以相对数量的方法二、试验资料的性质与分类Section2.2
次数分布表
表1100个麦穗的每穗小穗数18151719161520181917171817161820191716181716171918181717171818151618181817201918171915171717161718181719191719171816181717191616171717151716181918181919201716191817182019161819171615161817181717161917一、间断性变数资料的整理每穗小穗数(
y
)次数(f)1561615173218251917205总次数(
n
)100表2100个麦穗每穗小穗数的次数分布表从表2中看到,一堆杂乱的原始资料表,经初步整理后,就可了解资料的大致情况,另外,经过整理的资料也便于进一步的分析。每穗小穗数在15—20的范围内变动,把所有观察值按每穗小穗数多少加以归类,共分为6组,组与组间相差为1小穗,称为组距。这样可得表2形式的次数分布表。一、间断性变数资料的整理二、连续性变数资料的整理17721519797123159245119119131149152167104161214125175219118192176175951361991161652149515883137801381511871261961342061379897129143179174159165136108101141148168163176102194145173751301491501611551111581311899114214015415216312320514915513120918397119181149187131215111186118150155197116254239160172179151198124179135184168169173181188211197175122151171166175143190213192231163159158159177147194227141169124159表3140行水稻产量(单位:克)具体步骤:1.数据排序(sort)首先对数据按从小到大排列(升序)或从大到小排列(降序)。2.求极差(range)所有数据中的最大观察值和最小观察值的差数,称为极差,亦即整个样本的变异幅度。从表3中查到最大观察值为254g,最小观察值为75g,极差为254-75=179g。二、连续性变数资料的整理3.确定组数和组组距(classinterval)根据极差分为为若干组,每每组的距离相相等,称为组距。在确定组数和和组距时应考考虑:(1)观察值值个数的多少少;(2)极差的的大小;(3)便于计计算;(4)能反映映出资料的真真实面貌等方方面。样本大小(即即样本内包含含观察值的个个数的多少)与组数多少少的关系可参参照表4来确确定。二、连续续性变数资料料的整理表4样本容容量与组数多多少的关系样本内观察值的个数分组时的组数505—101008—1620010—2030012—2450015—30100020—40组数确定后,,还须确定组组距。组距=极差/组数数。以表3中140行水稻产量为为例,样本内内观察值的个个数为140,查表4可分分为8—16组,假定分为为12组,则组距为179/12=14.9g,为分组方便便起见,可以以15g作为组距。二、连续续性变数资料料的整理4.选定组限(classlimit)和组组中点值(组组值,classvalue)以表3中140行水稻产量为为例,选定第第一组的中点点值为75g,与最小观察察值75g相等;则第二二组的中点值值为75+15=90g,余类推。各组的中点值值选定后,就就可以求得各各组组限。每每组有两个组组限,数值小小的称为下限(lowerlimit),数值大的称称为上限(upperlimit)。上述资料中中,第一组的的下限为该组组中点值减去去1/2组距,即75-(15/2)=67.5g,上限为中点点值加1/2组距,即75+(15/2)=82.5g。故第一组的的组限为67.5—82.5g。按照此法计计算其余各组组的组限。二、连续续性变数资料料的整理5.把原始资料的的各个观察值值按分组数列列的各组组限限归组可按原始资料料中各观察值值的次序,逐逐个把数值归归于各组。待全部观察值值归组后,即即可求得各组组的次数,制制成一个次数数分布表。例如表3中第一个观察察值177应归于表5中中第8组,组限为172.5——187.5;第二个观察察值149应归于第6组,组限为142.5——157.5;…………。。依依次次把把140个观观察察值值都都进进行行归归组组,,即即可可制制成成140行水水稻稻产产量量的的次次数数分分布布表表(表表5)。。二、、连连续续性性变变数数资资料料的的整整理理表5140行行水水稻稻的的次次数数分分布布组限中点值(
y
)次数(f)67.5—82.575282.5—97.590797.5—112.51057112.5—127.512013127.5—142.513517142.5—157.515020157.5—172.516525172.5—187.518021187.5—202.519513202.5—217.52109217.5—232.52253232.5—247.52402247.5—262.52551合计(
n
)140注:前面面提提到到分分为为12组,,但但由由于于第第一一组组的的中中点点值值接接近近于于最最小小观观察察值值,,故故第第一一组组的的下下限限小小于于最最小小观观察察值值,,实实际际上上差差不不多多增增加加了了1/2组;;这这样样也也使使最最后后一一组组的的中中点点值值接接近近于于最最大大值值,,又又增增加加了了1/2组,,故故实实际际的的组组数数比比原原来来确确定定的的要要多多一一个个组组,,为为13组。。二、、连连续续性性变变数数资资料料的的整整理理三、、属属性性变变数数资资料料的的整整理理属性变数数的资料料,也可可以用类类似次数数分布的的方法来来整理。。在整理前前,把资资料按各各种质量量性状进进行分类类,分类类数等于于组数,,然后根据据各个体体在质量量属性上上的具体体表现,,分别归归入相应应的组中中,即可得到到属性分分布的规规律性认认识。例如,某某水稻杂杂种第二二代植株株米粒性状状的分离离情况,,归于表表6。表6水水稻杂种种二代植植株米粒性状状的分离离情况属性分组(
y
)次数(
f)红米非糯96红米糯稻37白米非糯31白米糯稻15合计(
n
)179Section2.3次次数分分布图一、方方柱形图图方柱形图图(histogram)适用于表表示连续续性变数数的次数数分布。。现以表3的140行水稻产产量的次次数分布布表为例例加以说说明。即即成方柱柱形次数数分布图图1。图1140行水稻产量次数分布方柱形图二、多边边形图多边形图图(polygon)也是表示示连续性性变数资资料的一一种普通通的方法法,且在在同一图图上可比比较两组组以上的的资料。。仍以140行水稻产产量次数数分布为为例,所所成图形形即为次次数多边边形图(图2)。图2140行水稻产量次数分布多边形图三、条条形图图条形图(bar)适用于间间断性变变数和属属性变数数资料,,用以表表示这些些变数的的次数分分布状况况。一般般其横轴轴标出间间断的中中点值或或分类性性状,纵纵轴标出出次数。现以表6水稻杂杂种第二二代米粒粒性状的的分离情情况为例例,可画画成水稻稻杂种第第二代植植株4种米粒性性状分离离情况条条形图(图3)。图3水水稻F2代米粒性性状分离离条形图图四、饼饼图饼图(pie)适用于间间断性变变数和属属性变数数资料,,用以表表示这些些变数中中各种属属性或各各种间断断性数据据观察值值在总观观察个数数中的百百分比。。如图4中白米糯糯稻在F2群体中占占8%,白米米非糯、、红米糯糯稻和红红米非糯糯分别占占17%、21%和54%。图4水稻F2代米粒性状分离的饼图Section2.4平平均数数一、平均均数的意意义和种种类平均数的的意义:平均数(average)是数据的的代表值值,表示示资料中中观察值值的中心心位置,,并且可可作为资资料的代代表而与与另一组组资料相相比较,,借以明明确二者者之间相相差的情情况。平均数的的种类:(1)算术平均均数一个数量量资料中中各个观观察值的的总和除除以观察察值个数数所得的的商数,,称为算术平均均数(arithmeticmean),记作。。因其其应用广广泛,常常简称平平均数或或均数(mean)。。均数的的大小决决定于样样本的各各观察值值。(2)中数将资料内内所有观观察值从从大到小小排序,,居中间间位置的的观察值值称为中数(median),计作作Md。如观观察值值个数数为偶偶数,,则以以中间间二个个观察察值的的算术术平均均数为为中数数。一、平平均数数的意意义和和种类类(3)众数资料中中最常常见的的一数数,或或次数数最多多一组组的中中点值值,称称为众数(mode),计作作MO。如棉棉花纤纤维检检验时时所用用的主主体长长度即即为众众数。。(4)几何平均数数如有n个观察值,,其相乘积积开n次方,即为为几何平均数数(geometricmean),用G代表。一、平均数数的意义和和种类二、算术平平均数的计计算方法若样本较小小,即资料料包含的观观察值个数数不多,可可直接计算算平均数。。设一个含含有n个观观察察值值的的样样本本,,其其各各个个观观察察值值为为x1、x2、x3、…、xn,则算术平均均数由下式算算得:若样本较大,,且已进行了了分组,可采采用加权法计计算算术平均均数,即用组组中点值代表表该组出现的的观测值以计计算平均数,,其公式为其中yi为第i组中点值,fi为第i组变数出现次次数。[例1]在在水稻品种种比较试验中中,湘矮早四四号的5个小区产量分分别为20.0、19.0、21.0、17.5、18.5kg,求该品种的的小区平均产产量。[例2]利利用表5资资料计算平均均每行水稻产产量。若采用直接法法,=157.47。因此,两者者的结果十分分相近。二、算术平均均数的计算方方法三、总体平均均数总体平均数用用来来代表,它同同样具有算术术平均数所具具有的特性。。上式Xi代表各个观察察值,N代表有限总体体所包含的个个体数,表表示示总体内各个个观察值的总总和。Section2.5
变异数数一、极差差极差(range),又称全距,记作R,是资料中最最大观察值与与最小观察值值的差数。表7两个个小麦品种的的每穗小穗数数品种名称每穗小穗数总和平均甲1314151718181921222318018乙1616171818181819202018018甲品种R=23-13=10;乙品种R=20-16=4。两品种的平均均同为18,但甲品种的的极差大,平平均数的代表表性差;乙品品种的极差小小,平均数代代表性好。二、、方方差差离均均差差平平方方和和(简简称称平平方方和和)SS样本本SS=总体体SS=均方方或或方方差差(variance)样本本均均方方(meansquare):总体体方方差差:样本本均均方方是是总总体体方方差差的的无无偏偏估估计计值值三、、标标准准差差(一一)标标准准差差的的定定义义样本本标标准准差差::总体体标标准准差差::样本本标标准准差差是是总总体体标标准准差差的的估估计计值值。。(二二)自自由由度度样本本n-1称称为为自自由由度度,记记作作DF,其其具具体体数数值值则则常常用用表表示示。。统计计意意义义:是是指指样样本本内内独独立立而而能能自自由由变变动动的的离离均均差差个个数数。。三、、标标准准差差(三三)标标准准差差的的计计算算方方法法1.直直接接法法[例例3]设设某某一一水水稻稻单单株株粒粒重重的的样样本本有有5个个观观察察值值,,以以克克为为单单位位,,其其数数为为2、、8、、7、、5、、4。。计算项目yy22-3.210.24482.87.846471.83.24495-0.20.04254-1.21.4416总和26022.80158平均5.2三、、标标准准差差2..矫正正数数法法其中中项项称称为为矫矫正正数数,,记记作作C。在上上例例中中,,将将有有关关数数字字代代入入即即有有::三、、标标准准差差3..加权权法法若样样本本较较大大,,已已生生成成次次数数分分布布表表,,可可采采用用加加权权法法计计算算标标准准差差,,其其公公式式为为::三、、标标准准差差[例例4]利利用用表表5的的次次数数分分布布资资料料计计算算每每行行水水稻稻产产量量的的标标准准差差。。若采用直直接法,,其标准准差s=36.23(g)。由此可可见,直直接法和和加权法法的结果果是很相相近的。。三、标准准差四、变异异系数变异系数数(coefficientofvariation):变异系数数是一个个不带单单位的纯纯数,可可用以比比较二个个事物的的变异度度大小。。例如表8为两个个小麦品品种主茎茎高度的的平均数数、标准准差和变变异系数数。如只只从标准准差看,,品种甲甲比乙的的变异大大些;但但因两者者的均数数不同,,标准差差间不宜宜直接比比较。如如果算出出变异系系数,就就可以相相互比较较,这里里乙品种种的变异异系数为为11.3%,甲品品种为9.5%,可见见乙品种种的相对对变异程程度较大大。品种(cm)s(cm)变异系数CV(%)甲95.09.029.5乙75.08.5011.3表8两个小麦麦品种主主茎高度度的测量量结果四、变异异系数9、静夜四无邻邻,荒居旧业业贫。。12月-2212月-22Saturday,December24,202210、雨中中黄叶叶树,,灯下下白头头人。。。05:52:2705:52:2705:5212/24/20225:52:27AM11、以我独沈沈久,愧君君相见频。。。12月-2205:52:2705:52Dec-2224-Dec-2212、故人江海海别,几度度隔山川。。。05:52:2705:52:2705:52Saturday,December24,202213、乍乍见见翻翻疑疑梦梦,,相相悲悲各各问问年年。。。。12月月-2212月月-2205:52:2705:52:27December24,202214、他乡生生白发,,旧国见见青山。。。24十十二月20225:52:27上午午05:52:2712月-2215、比不不了得得就不不比,,得不不到的的就不不要。。。。。十二月月225:52上上午午12月月-2205:52December24,202216、行动动出成成果,,工作作出财财富。。。2022/12/245:52:2705:52:2724December202217、做前前,能能够环环视四四周;;做时时,你你只能能或者者最好好沿着着以脚脚为起起点的的射线线向前前。。。5:52:27上上午5:52上上午午05:52:2712月月-229、没有失败败,只有暂暂时停止成成功!。12月-2212月-22Saturday,December24,202210、很很多多事事情情努努力力了了未未必必有有结结果果,,但但是是不不努努力力却却什什么么改改变变也也没没有有。。。。05:52:2805:52:2805:5212/24/20225:52:28AM11、成功就是日日复一日那一一点点小小努努力的积累。。。12月-2205:52:2805:52Dec-2224-Dec-2212、世间成事,,不求其绝对对圆满,留一一份不足,可可得无限完美美。。05:52:2805:52:2805:52Saturday,December24,202213、不知知香积积寺,,数里里入云云峰。。。12月月-2212月月-2205:52:2805:52:28December24,202214、意志志坚强强的人人能把把世界界放在在手中中像泥泥块一一样任任意揉揉捏。。24十十二二月20225:52:28上上午05:52:2812月月-2215、楚楚塞塞三三湘湘接接,,荆荆门门九九派派通通。。。。。。十二二月月225:52上上午午12
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025-2030中国地下变压器行业市场深度调研及发展趋势和前景预测研究报告
- 2025-2030中国喇叭行业市场发展分析及前景趋势与投资研究报告
- 2025-2030中国商业烟雾报警器行业市场发展趋势与前景展望战略研究报告
- 2025-2030中国口罩用无纺布行业市场发展分析及发展趋势预测与战略投资研究报告
- 工业互联网平台搭建投资合同
- 机械设备购销合同
- 吊灯销售合同
- 水利工程建设与管理合同
- 再婚婚前协议书
- 四年级班主任学科竞赛计划
- 2025年中国液态储氢行业发展现状、市场规模、投资前景分析报告(智研咨询)
- 鉴乐·赏舞知到智慧树章节测试课后答案2024年秋绥化学院
- 2025年河南工业职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2025年江苏无锡市江阴市新国联集团有限公司子公司招聘笔试参考题库附带答案详解
- Unit2 Travelling Around Reading for Writing 说课稿-2024-2025学年高中英语人教版(2019)必修第一册
- 宗祠祭祖祭文范文
- 年产8.5万吨钙基高分子复合材料项目可行性研究报告模板-立项备案
- 美育(威海职业学院)知到智慧树答案
- rules in the zoo动物园里的规则作文
- 《森林防火安全教育》主题班会 课件
- 人工喂养课件教学课件
评论
0/150
提交评论