




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、试验资料的整理特征数的计算与第第 二二 章章第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理对试验资料进行分类是统计归纳的基础。对试验资料进行分类是统计归纳的基础。试试验验资资料料类类型型数量性状资料数量性状资料质量性状资料属性性状资料质量性状资料属性性状资料计数资料非连续变量资料计数资料非连续变量资料计量资料连续变量资料计量资料连续变量资料一、数量性状资料一、数量性状资料株数频率红花26626.6%紫花49449.4%白花24024.0%总计1000100.0%第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理调 查试 验资料
2、搜集的方法资料搜集的方法一、调查一、调查 调查调查是对已经存在的事情的资料按某种方案进行收集的方法。资料的调查又可以分为两种:普查和抽样调查。1、普查普查 是对研究对象的全部个体逐一进行调查的方法。普查一般要求在一定的时间或范围进行,要求准确和全面。2、抽样调查、抽样调查 是根据一定的原则从研究对象中抽取一部分具有代表性的个体进行调查的方法。通过抽样将获得的样本资料进行统计处理,然后利用样本的特征数对总体进行推断。 随机抽样:随机抽样:u 总体中每个个体被抽中的机会是均等的;u 总体中任意一个个体是相互独立的,是否被抽中不受其他个体的影响。二、试验二、试验 试验:试验:无限总体获得样本资料的一
3、种方法。 常见的试验设计方法有:对比设计、随机区组设计、平衡不完全区组设计、裂区设计、拉丁方设计、正交设计、正交旋转设计等等。 试验设计须遵循的三大原则是:随机、重复和局随机、重复和局部控制部控制。第一节:试验资料的搜集与整理一、试验资料的类型二、试验资料的搜集三、试验资料的整理(一)原始资料的检查与核对(一)原始资料的检查与核对调查试验原始数据核对检查订正(二)次数分布表(二)次数分布表:总横标目(或空白)纵标目1纵标目2横标目1横标目2数字资料表号 标题1 计数资料的整理计数资料基本上采用单项式分组法进行整理。特点:用样本变量自然值进行分组,每组用一个或几个变量值来表示。15 17 12
4、14 13 14 12 11 14 13 16 14 14 13 17 15 14 14 16 1414 15 15 14 14 14 11 13 12 1413 14 13 15 14 13 15 14 13 1415 16 16 14 13 14 15 13 15 1315 15 15 14 14 16 14 15 17 1316 14 16 15 13 14 14 14 14 1612 13 12 14 12 15 16 15 16 1413 15 17 14 13 14 12 17 14 15表2-1 100只来亨鸡每月的产蛋数1117来亨鸡每月产蛋数变动范围:分为7组统计各组次数计算
5、频率和累积频率制表每月产蛋数 次数 频率 累积频率 Frequency Percent Cumulative Percent 11 2 0.02 0.02 12 7 0.07 0.09 13 19 0.19 0.28 14 35 0.35 0.63 15 21 0.21 0.84 16 11 0.11 0.95 17 5 0.05 1.00表2-2 100只来亨鸡每月产蛋数次数分布表2 计量资料的整理计量资料一般采用组距式分组法。全距组数组距组限归组制表表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51
6、 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770
7、69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63(1) 求全距, 又称极差 (range):R=Xmax- Xmin =85-37 =48(cm)(2) 确定组数和组距(class boundary) 组数是根据样本观测数的多少及组距的大小来确定的,同时考虑到对资料要求的精确度以及进一步计算是否方便。组数组距多小统计数精确,计算不方便少大统计数不精确,计算方便组数的确定组距的确定即每组内的上下限范围。组距全距/组数48104.8(3)确定组限(class limit)和组中
8、值(class midvalue) 是指每个组变量值的起止界限。上限下限是两个组限的中间值。组中值下限上限 2组距2下限组距2上限表2-4150尾鲢鱼体长(cm)56 49 62 78 41 47 65 45 58 55 59 65 69 62 7352 52 60 51 62 78 66 45 58 58 60 57 52 51 4856 46 58 70 72 76 77 56 66 58 58 55 53 50 6563 57 65 85 59 58 54 62 48 63 46 61 62 57 3858 52 54 55 66 52 48 56 75 72 57 37 46 76 5
9、663 75 65 48 52 55 54 62 71 48 62 58 46 57 3854 53 65 42 83 66 48 53 58 46 46 26 36 76 5560 54 58 49 52 56 82 63 65 54 75 65 86 46 7770 69 40 56 58 61 54 53 52 43 52 64 58 58 5478 52 56 61 59 54 59 64 68 51 59 68 63 52 63(4) 分组分组确定好组数和各组上下限后,可按原始资料中各观确定好组数和各组上下限后,可按原始资料中各观测值的次序,将各个数值归于各组,计算各组的观测值的次序
10、,将各个数值归于各组,计算各组的观测数次数、频率、累积频率,制成一个次数分布表。测数次数、频率、累积频率,制成一个次数分布表。计数的方法计数的方法卡片法卡片法唱票法唱票法画画“正正”字字画画“ ” 组限 组中值 次数 频率 累积频率 Frequency Percent Cumulative Percent 35 37.5 3 0.0200 0.0200 40 42.5 4 0.0267 0.0467 45 47.5 17 0.1133 0.1600 50 52.5 28 0.1867 0.3467 55 57.5 40 0.2666 0.6133 60 62.5 25 0.1667 0.780
11、0 65 67.5 17 0.1133 0.8973 70 72.5 6 0.0400 0.9333 75 77.5 7 0.0467 0.9800 80 82.5 2 0.0133 0.9933 85 87.5 1 0.0067 1.0000表2-6 150尾鲢鱼体长(cm)的次数分布表(三)次数(频率)分布图(三)次数(频率)分布图定义:把次数(频率)分布资料画成统计图形。特点:直观、形象包括:条形图、直方图、多边形图、饼图和散点图特征数的计算集中性离散性平均数平均数变异数变异数算术平均数算术平均数中位数中位数众数众数几何平均数几何平均数极差极差方差方差标准差标准差变异系数变异系数调和平均
12、数调和平均数一、平均数一、平均数 平均数平均数 平均数是统计学中最常用的统计量,是计量资料的代表值,表示资料中观测数的中心位置,并且可作为资料的代表与另一组相比较,以确定二者的差异情况。(一)平均数的种类(一)平均数的种类1. 算术平均数算术平均数 (arithmetic mean)定义:总体或样本资料中所有观测数的总和除以观测数定义:总体或样本资料中所有观测数的总和除以观测数 的个数所得的商,简称平均数、均数或均值。的个数所得的商,简称平均数、均数或均值。总体:总体:x1+x2+x3+xNNN1Nixi1样本:样本:x1+x2+x3+xnnx xn1nixi12. 中位数中位数(median
13、) 资料中所有观测数依大小顺序排列,居于中间位置资料中所有观测数依大小顺序排列,居于中间位置的观测数称为中位数或中数。的观测数称为中位数或中数。Md2/ )1( nx2)12/(2/nndxxM3. 众数众数(mode) 资料中出现次数最多的那个观测值或次数最多一组的资料中出现次数最多的那个观测值或次数最多一组的组中值或中点值。组中值或中点值。M0注意:注意:(1)对于某些数据而言,如均匀分布,并不存在众数;)对于某些数据而言,如均匀分布,并不存在众数;(2)对于某些数据存在两个或两个以上的众数;)对于某些数据存在两个或两个以上的众数;(3)主要用来描述频率分布。)主要用来描述频率分布。一、平
14、均数4. 几何平均数几何平均数 (geometric mean)资料中有资料中有n个观测数,其乘积开个观测数,其乘积开n次方所得数值。次方所得数值。G适用范围:几何均数适用于变量适用范围:几何均数适用于变量X为对数正态分布,为对数正态分布,经对数转换后呈正态分布的资料。经对数转换后呈正态分布的资料。G=nxnxxx*.3*2*1(二)算术平均数的计算方法(二)算术平均数的计算方法例:随机抽取20株小麦测量它们的株高(cm)分别为:82 79 85 84 86 84 83 82 83 8384 81 80 81 82 81 82 82 82 80 求小麦的平均株高。 xn20(82+79+80)
15、82.3(cm)ix例:设a为80(cm)则有:82 79 85 84 86 84 83 82 83 83 2 1 5 4 6 4 3 2 3 384 81 80 81 82 81 82 82 82 80 4 1 0 1 2 1 2 2 2 0 x20(21+5+ +0)82.3(cm)+ 80 xffxfxffffxfxfxfxkiikiiikkk11212211 若为若为,则用每组组中值乘以该组次数,则用每组组中值乘以该组次数之和再除以总次数来计算:之和再除以总次数来计算:(x-x) = 0(x-x) 2 (x-a) 2 (三)算术平均数的重要性质(三)算术平均数的重要性质变异数的种类变异
16、数的种类 是数据分布的两端变异的最大范围,即样本变量值最大值和最小值之差,用R表示。它是资料中各观测值变异程度大小的最简便的统计量。例:150尾鲢鱼体长 R=85-37=48(cm)R = maxx1,x2, xn - minx1,x2, xn =x1,x2, xnmax - x1,x2, xnmin(二)方差(二)方差(Variance)(x-x ) 2 n-1S2 =2=(x-) 2 N样本总体自由度自由度(DF)的的含义含义 自由度(degree of freedom):表示一个质点在空间运动的自由程度。统计学借此来反映一批变量的约束条件。 例如一个有5个观察值的样本,因为受到统计数 的约束,在5个离均差中,只有4个数值可以在一定范围内自由变动取值,而第五个离均差必须满足 这一限制条件。(x-x ) = 0 x(三)标准差(三)标准差(standard deviation, Sd)S =(x-x ) 2 n-1=(x-) 2 N样本总体(三)标准差(三)标准差(standa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 互联网行业新趋势
- 摩擦力高一上学期物理人教版(2019)必修第一册
- 入队知识培训课件图片
- 2024年八年级生物下册 7.1.2食品保存教学实录 (新版)济南版
- 夏天防溺水安全教育课件
- 2025工程合同协议书模板
- 四年级品德与社会下册 第四单元 交通连着千万家 活动主题三 平安走天下教学实录 教科版
- 2025专业版电子文档库购买合同
- 2025版建筑工程法规及相关知识章节练习宝典解析:施工合同法律制度
- 2025合同能效管理协议
- 第8课 现代社会的移民和多元文化 同步课件高二下学期历史统编版(2019)选择性必修3文化交流与传播
- (完整版)《互联网金融概论》第五章-众筹融资
- T-SCBDIF 001-2024 AI 大模型应用能力成熟度评价标准
- 源网荷储一体化试点项目可行性研究报告模板
- 2025-2030年中国松茸市场运行现状及发展前景预测报告
- 产品销售双方保密协议范本
- 2025版新冠肺炎护理:全方位护理要点解读
- 超高龄患者ERCP的麻醉管理
- 《光电对抗原理与应用》课件第6章
- 大学生创新创业知能训练与指导知到智慧树章节测试课后答案2024年秋西北农林科技大学
- 2024年浙江省中考社会(开卷)真题卷及答案解析
评论
0/150
提交评论