生物统计学第二章资料的描述性统计分析_第1页
生物统计学第二章资料的描述性统计分析_第2页
生物统计学第二章资料的描述性统计分析_第3页
生物统计学第二章资料的描述性统计分析_第4页
生物统计学第二章资料的描述性统计分析_第5页
已阅读5页,还剩27页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、11生物统计学,一整本书的有关生物统计学,一整本书的有关PPT都有都有 ,其,其他的在我空间的文库里他的在我空间的文库里 ,有需要的可以去,有需要的可以去光顾下,看看你有没需要的光顾下,看看你有没需要的12第二章第二章 资料整理资料整理资料整理:资料整理: 对对原始资料原始资料进行进行审核、分组、汇总、描述和审核、分组、汇总、描述和归纳归纳,使之条理化和便于统计分析和推断。,使之条理化和便于统计分析和推断。13原始资料:统计调查和实验结果原始资料:统计调查和实验结果(1)如牛场、鸡场和猪场的性能测定结果)如牛场、鸡场和猪场的性能测定结果 (产奶量、产蛋数、产仔数、称重等);(产奶量、产蛋数、产

2、仔数、称重等);(2)屠宰试验结果;)屠宰试验结果;(3)实验结果包括基因型、特异条带的有)实验结果包括基因型、特异条带的有 无、强弱;饲料成分的含量等无、强弱;饲料成分的含量等第二章第二章 资料整理资料整理14第二章第二章 资料整理资料整理原始数据:原始数据: 大量的、大量的、“杂乱无章杂乱无章” 不能直接用于统计分析,必须经过统整理不能直接用于统计分析,必须经过统整理和加工。和加工。15第二章第二章 资料整理资料整理资料整理的主要内容资料整理的主要内容(1)审核与订正审核与订正:人为错误、小数点等:人为错误、小数点等(2)分组与汇总分组与汇总:内部结构、类型和特征:内部结构、类型和特征(3

3、)计计 算各种综合数字特征算各种综合数字特征:如,:如,n、平均数、标准差、平均数、标准差(4)统计表或统计图统计表或统计图:显示资料的基本特征和内在规律:显示资料的基本特征和内在规律 16第二章第二章 资料整理资料整理2.1 资料的分类资料的分类2.2 数据的频率分布数据的频率分布2.3 数据的表示方法数据的表示方法2.4 集中趋势的度量集中趋势的度量2.5 离散趋势的度量离散趋势的度量172.1 资料的分类资料的分类统计资料:指反映事物、现象或过程的数据资料。统计资料:指反映事物、现象或过程的数据资料。 包括原始资料和次级资料。包括原始资料和次级资料。特点:特点:(1)数字性:)数字性:数

4、字形式或者可以转换为数字形式。数字形式或者可以转换为数字形式。(2)大量性:)大量性:大量相像或对同类相像观察所取得的大量相像或对同类相像观察所取得的 数据资料。数据资料。(3)具体性:)具体性:已经实现的事实的记载。已经实现的事实的记载。182.1.1 连续性资料(或计量资料)连续性资料(或计量资料) 指一定范围内可取任何实数值的数据资料,通指一定范围内可取任何实数值的数据资料,通常是用度量衡等计量工具测量后得到的。常是用度量衡等计量工具测量后得到的。 如:体重、产奶量、产毛量等。如:体重、产奶量、产毛量等。 数据的连续性受到实际测定规模和测量工具精度数据的连续性受到实际测定规模和测量工具精

5、度的限制,如:天平和尺的精确程度。的限制,如:天平和尺的精确程度。 实际得到的资料并非完全连续的,连续性只是理实际得到的资料并非完全连续的,连续性只是理论上的。论上的。192.1.1 离散性资料离散性资料 指一定范围内只取有限种可能值的数据资料。指一定范围内只取有限种可能值的数据资料。1.计数资料:计数资料:计数的方式得到,必须用整数表示。计数的方式得到,必须用整数表示。 如:产蛋数、产仔数。如:产蛋数、产仔数。2.分类资料:分类资料:可分为多个不同的类别。可分为多个不同的类别。(1)不同类别之间无等级之分。)不同类别之间无等级之分。 如:性别(公母)、如:性别(公母)、 基因型(基因型(AA

6、 AB BB)、毛)、毛 色(红、白、黑)。色(红、白、黑)。110(2)不同类别之间有内在的等级之分。)不同类别之间有内在的等级之分。 如:成绩(优、良、高)、产奶量(高、中、低)如:成绩(优、良、高)、产奶量(高、中、低) 分类资料可以用文字描述,也可以转换为数字,用自分类资料可以用文字描述,也可以转换为数字,用自然数来表示。然数来表示。 如:如:0代表公,代表公,1代表母。代表母。 不同的数字只代表类型,不代表大小。不同的数字只代表类型,不代表大小。2.1.1 离散性资料离散性资料1112.2 数据的频率分布数据的频率分布 频率分布反映一组数据中不同观测出现频率。频率分布反映一组数据中不

7、同观测出现频率。对数据的分布特征和趋势一目了然。对数据的分布特征和趋势一目了然。2.2.1 2.2.1 离散性资料的频率分布离散性资料的频率分布 计数资料和分类资料的频率分布指每个自然值计数资料和分类资料的频率分布指每个自然值或属于不同类别的观测值出现的次数(频数)和或属于不同类别的观测值出现的次数(频数)和所占的比例。所占的比例。 见教材见教材 P7-8 P7-8 表表2-12-1和表和表2-22-2。112781114101211101071012111010119128101210101181081011131091112101299111011111311141310111311131

8、0109111189911107101312121310119表表2-1 70头经产母猪窝产仔数资料头经产母猪窝产仔数资料 单位:头 113表表2-2 70头经产母猪窝产仔数资料的频数分布表头经产母猪窝产仔数资料的频数分布表 产仔数产仔数频数频数累计频数累计频数频率(频率(%)7222.868577.14991612.8610203628.5711175324.291286111.431376810.00142702.86总和总和70 100.211142.2.2 连续性资料的频率分布连续性资料的频率分布 首先,首先,将资料进行分组将资料进行分组 然后,然后,将观测值分别纳入相应的组内将观测值

9、分别纳入相应的组内 最后,最后,计算各组中观测值的频数和频率计算各组中观测值的频数和频率以以200200头金华猪头金华猪2 2月龄体重资料为例月龄体重资料为例11517.0 11.0 14.3 13.0 15.5 10.0 13.5 16.0 11.5 14.5 12.016.5 13.0 12.8 15.5 11.5 13.0 13.0 12.0 9.0 11.8 19.3 14.0 15.0 14.0 11.5 15.0 13.5 13.0 12.3 14.8 15.5 13.0 15.0 17.5 9.0 13.5 14.5 13.0 9.5 10.3 14.0 17.5 12.0 14

10、.5 12.5 11.5 12.8 15.0 18.0 13.5 14.3 14.5 8.5 15.3 17.5 10.5 12.5 9.0 13.0 10.5 12.5 15.5 8.9 12.5 17.5 14.5 13.0 13.5 11.0 17.9 13.0 13.5 16.5 15.3 15.0 13.5 14.5 9.0 10.5 19.0 12.5 13.0 14.5 12.5 13.0 12.5 16.5 13.0 12.5 9.5 12.0 10.0 12.0 11.0 12.5 11.0 11.5 10.0 12.5 9.3 12.0 11.5 11.0 11.5 10.

11、5 11.5 12.0 9.5 16.5 11.3 11.5 8.8 11.5 9.5 13.0 12.5 13.0 12.5 14.5 11.0 11.5 14.5 14.0 12.5 12.5 11.5 13.0 9.0 13.5 13.3 10.0 12.5 17.5 11.5 10.0 10.0 11.0 11.5 9.0 16.6 15.0 15.8 16.8 13.5 12.5 9.0 10.5 15.0 14.0 16.3 15.5 12.3 11.0 14.0 13.0 17.0 12.0 17.0 11.5 16.5 12.0 11.5 13.5 11.5 16.0 9.0

12、11.0 15.0 11.5 11.0 17.0 14.5 15.0 11.0 18.8 12.0 13.5 14.0 11.5 15.0 12.0 15.5 15.0 11.3 17.0 16.0 12.0 15.5 11.8 12.5 9.8 10.0 14.5 12.5 12.0 10.5 13.0 16.0 11.8 表表2-2 200头金华猪二月龄体重资料头金华猪二月龄体重资料单位:kg1162.2.2 连续性资料的频率分布连续性资料的频率分布 一、数据分组一、数据分组 求全距:求全距:变数的最大值与最小值之差变数的最大值与最小值之差 R=19.3-8.5=10.8 (Range)2

13、. 确定组数:确定组数:取决于样本含量,初步确定为取决于样本含量,初步确定为12组,组,参考表参考表243. 确定组距:确定组距:每组的最大值与最小值之差每组的最大值与最小值之差 组距全距组距全距/组数,组数,i=10.8 12=0.9 (Interval) 组距为整数(计算得到的小数化为整数),组距为整数(计算得到的小数化为整数), 各组的组距相同,用各组的组距相同,用 i 表示,取整数表示,取整数1作为组距。作为组距。117变数的个数(变数的个数(n)分组的组数分组的组数306068601007101002009122005001217500以上以上1730表表2-4 2-4 样本含量与组

14、数的关系样本含量与组数的关系 1182.2.2 连续性资料的频率分布连续性资料的频率分布4. 求组中值和组限求组中值和组限 组限:每组的两个极限值组限:每组的两个极限值 组下限:最小值组下限:最小值 组上限:最大值组上限:最大值 组中值:(组上限组中值:(组上限+组下限)组下限)/2 组下限组下限= 组中值组中值- 0.5X组距组距 一般是首先确定第一组的组中值,然后根据加上组一般是首先确定第一组的组中值,然后根据加上组距得到第二组的组中值,依次类推距得到第二组的组中值,依次类推 本例为本例为8.5,组下限为,组下限为8,依次类推,依次类推119 一般是首先确定第一组的组中值,然后加上组距得一

15、般是首先确定第一组的组中值,然后加上组距得到第二组的组中值,依次类推到第二组的组中值,依次类推 第一组的组中值一般接近或等于资料中的最小值,第一组的组中值一般接近或等于资料中的最小值,这样可以避免资料中的最小值被排除在外。这样可以避免资料中的最小值被排除在外。 为避免上一组的组上限与下一组的组下限相等时,为避免上一组的组上限与下一组的组下限相等时,使得其分组时的归属问题,通常采用将该数值向后靠的使得其分组时的归属问题,通常采用将该数值向后靠的原则,即上一组的组上限稍小于下一组的组下限。原则,即上一组的组上限稍小于下一组的组下限。或采用开口式分组,即每组无确定的组上限。或采用开口式分组,即每组无

16、确定的组上限。2.2.2 连续性资料的频率分布连续性资料的频率分布1202.2.2 连续性资料的频率分布连续性资料的频率分布 二、计算频率分布二、计算频率分布 根据组限,将资料中的数据分别分配到各组根据组限,将资料中的数据分别分配到各组中,然后计算各组的频数和频率。从而很容易地中,然后计算各组的频数和频率。从而很容易地了解资料的特点。了解资料的特点。 见表见表2-5 小结:计算全距小结:计算全距 分组分组 组限组限 全距全距 组数组数 组距组距121组别组别组中值组中值频数频数累计频数累计频数频率(频率(% %)8 88.58.53 33 31.51.59 99.59.5141417177.0

17、7.0101010.510.5141431317.07.0111111.511.53535666617.517.5121212.512.5353510110117.517.5131313.513.5303013113115.015.0141414.514.5212115215210.510.5151515.515.5212117317310.510.5161616.516.512121851856.06.0171717.517.511111961965.55.5181818.518.52 21981981.01.0191919.519.52 22002001.01.0总和总和 200200 1

18、00.0100.0表表2-5 200头金华猪二月龄体重资料的频数分布表头金华猪二月龄体重资料的频数分布表 1222.2.3 百分位数(百分位点)百分位数(百分位点) 指将一组指将一组 n 个数据由小到大排列,如果小于个数据由小到大排列,如果小于 某数值某数值的数据个数为全体数据个数的的数据个数为全体数据个数的x%,则称该数为第,则称该数为第 x 百分百分位数或位数或 x% 分位数。分位数。 25%分位数或下四分位数:分位数或下四分位数:0.25n个数的最后一个数。个数的最后一个数。 50%分位数或中位数:分位数或中位数:0. 5n个数的最后一个数。个数的最后一个数。 75%分位数或上四分位数:

19、分位数或上四分位数:0.75n个数的最后一个数。个数的最后一个数。1232. 3 统计表统计表统计资料的基本表现形式,也是最常见的形式。统计资料的基本表现形式,也是最常见的形式。使得数据具有条理性、清晰易懂、便于比较和分析。使得数据具有条理性、清晰易懂、便于比较和分析。 形式:标题、纵列标题、横列标题、表体形式:标题、纵列标题、横列标题、表体 见表见表2-5类型:简单表(一组横标目和一组列标目)类型:简单表(一组横标目和一组列标目) 复合表(多组横标目和一组列标目、一复合表(多组横标目和一组列标目、一 组横标目和多组列标目、多组横标目和多组横标目和多组列标目、多组横标目和多 组列标目)组列标目

20、) 见见p114 例例8-7 表和表和p204 表表13-14124 利用点、线、面、体形象、直观地表示统计资料的利用点、线、面、体形象、直观地表示统计资料的基本特征和变化趋势。基本特征和变化趋势。一、条形图一、条形图 利用平行柱型的长短表示数的大小。利用平行柱型的长短表示数的大小。 适用于分类资料和离散性数量资料的频率分布适用于分类资料和离散性数量资料的频率分布 见图见图2-1 2. 4 统计图统计图125产仔数14.0013.0012.0011.0010.009.008.007.00Max 频数3020100图图2-1 70头经产母猪窝产仔数的频数分布图头经产母猪窝产仔数的频数分布图126二、直方图二、直方图 利用距形面积表示各组中数据出现的频数。利用距形面积表示各

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论