版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、第二章第二章 资料的整理与描述资料的整理与描述第一节第一节 总体和样本总体和样本 第二节第二节 资料的整理资料的整理第三节第三节 资料的描述资料的描述第一节第一节 总体及其样本总体及其样本l一、总体一、总体( population )( population ) l1. 1.总体的概念总体的概念:具有共同性质的个体所组成的集团。:具有共同性质的个体所组成的集团。 有限总体有限总体-由有限个个体构成的总体。由有限个个体构成的总体。 无限总体无限总体-总体所包含的个体数目有无穷多个。总体所包含的个体数目有无穷多个。l2. 2.观察值观察值( observation )( observation )
2、:每一个体的某一性状、特性:每一个体的某一性状、特性的测定数值。的测定数值。l3. 3.变数变数( variable )( variable ) -观察值集合起来,称为总体的变观察值集合起来,称为总体的变数。变数又称为随机变数数。变数又称为随机变数(random variable)。l4.4.变量:变数中的每一成员称为变量。变量:变数中的每一成员称为变量。l5.5.参数:参数: 由总体全部观察值计算得到的特征数,由总体全部观察值计算得到的特征数,称为参数。称为参数。一般用希腊字母表示。一般用希腊字母表示。 l 二、样本二、样本l 1.1.样本样本( sample ) -( sample ) -
3、从总体中抽取若干个个体从总体中抽取若干个个体的集合称为样本的集合称为样本(sample)(sample)。一、总体一、总体( population )l2. 2.统计数统计数( statistic )( statistic ) -测定样本中的各个体而得的测定样本中的各个体而得的样本特征数,如平均数等,称为统计数样本特征数,如平均数等,称为统计数(statistic)。拉丁字母表示拉丁字母表示l3. 3.随机样本随机样本( random sample )( random sample ) -从总体中随机抽取从总体中随机抽取的样本称为随机样本的样本称为随机样本(random sample) l4.
4、 4.样本容量样本容量 ( sample size )( sample size ) -样本中包含的个体数样本中包含的个体数称为样本容量或样本含量称为样本容量或样本含量(sample size) 二、样本二、样本y 第二节第二节 资料的整理资料的整理 一一 试验资料性质与分类试验资料性质与分类 (一)数量性状资料(一)数量性状资料 度量有计数和量测两种方式度量有计数和量测两种方式 1.1.计量资料计量资料:指称量、度量或测量方法得到的数指称量、度量或测量方法得到的数据,也称为连续性变数。据,也称为连续性变数。 2.2.计数资料:指用计数方法获得的数据,也称为间计数资料:指用计数方法获得的数据,
5、也称为间断性变数。断性变数。数量性状资料(数量性状资料(quantitative traitquantitative trait) 采用计数和量测两种方式所得到的数据。采用计数和量测两种方式所得到的数据。间断性变数间断性变数Discontinuous or Discontinuous or discrete variablediscrete variable连续性变数连续性变数continuous variablecontinuous variable小麦基本苗数、菌落数、小麦基本苗数、菌落数、穗数、分孽数等等穗数、分孽数等等病斑长度、作物产量、病斑长度、作物产量、株高、土壤水分含量等等株高、
6、土壤水分含量等等( (二)二) 质量性状资料(质量性状资料(qualitative traitqualitative trait) 观察而观察而不能量测性状,如菌落的颜色、麦穗有无芒等等。不能量测性状,如菌落的颜色、麦穗有无芒等等。统计次数法统计次数法给分法给分法统计具有某个性状的个统计具有某个性状的个体数目及具有不同性状的体数目及具有不同性状的个体数目,按类别计其个体数目,按类别计其次数或相对次数次数或相对次数给予每类性状以相对数给予每类性状以相对数量的方法,如小麦籽粒有量的方法,如小麦籽粒有红白两种颜色,可用红白两种颜色,可用0 0表示白色,用表示白色,用1 1表示红色表示红色 (一)次数
7、分布表(一)次数分布表对小样本(对小样本(n30n30)资料不必分组,直接统计分析。)资料不必分组,直接统计分析。当样本较大(当样本较大(n n3030)时,要分组,制成次数分布表。)时,要分组,制成次数分布表。1.1.计数资料的整理计数资料的整理 (1 1)对于观察值不多、变异范围不大的计数资料,)对于观察值不多、变异范围不大的计数资料,以每一观察值为一组进行分组,然后制成次数分布表。以每一观察值为一组进行分组,然后制成次数分布表。例如,随机调查例如,随机调查100100个麦穗,计数每穗小穗数,原始个麦穗,计数每穗小穗数,原始数据列于表数据列于表2-12-1。二、资料整理的方法二、资料整理的
8、方法表表2-1 1002-1 100个麦穗的每穗小穗数个麦穗的每穗小穗数18 15 17 19 16 15 20 18 19 17 17 18 17 16 18 20 19 17 16 1817 16 17 19 18 18 17 17 17 1818 15 16 18 18 18 17 20 19 1817 19 15 17 17 17 16 17 18 1817 19 19 17 19 17 18 16 18 1717 19 16 16 17 17 17 15 17 1618 19 18 18 19 19 20 17 16 1918 17 18 20 19 16 18 19 17 1615
9、 16 18 17 18 17 17 16 19 17(一)次数分布表(一)次数分布表 每穗小穗数(每穗小穗数(x x) 划线计数划线计数 次数(次数( )15 616 1517 3218 2519 1720 5 总次数总次数 100表表2-2 1002-2 100个麦穗每穗小穗数的次数分布表个麦穗每穗小穗数的次数分布表(一)次数分布表(一)次数分布表 (2 2)观察值较多,变异范围较大,可把)观察值较多,变异范围较大,可把几个相几个相邻的观察值并为一组邻的观察值并为一组。 (一)次数分布表(一)次数分布表 每穗粒数(每穗粒数(x x) 次数(次数( ) 2630 1 3135 3 3640
10、10 4145 21 4650 32 5155 41 5660 38 6165 25 6670 16 7175 8 7680 3 8185 2 合合 计计 200 2.2.计量资料的整理计量资料的整理 计量资料在分组前需要确定全距、组数、组距、计量资料在分组前需要确定全距、组数、组距、组中值及组限,然后将全部观测值划线计数归组组中值及组限,然后将全部观测值划线计数归组制成次数分布表。制成次数分布表。 以表以表2-42-4中中140140行水稻产量为例,说明计量资行水稻产量为例,说明计量资料整理的方法与步骤。料整理的方法与步骤。(一)次数分布表(一)次数分布表 表表2-4 1402-4 140行
11、水稻产量行水稻产量 (单位:(单位:g)177 215 197 97 123 159 245 119 119 131 149 152 167 104 177 215 197 97 123 159 245 119 119 131 149 152 167 104 161 214 125 175 219 118 192 176 175 95 136 199 116 165161 214 125 175 219 118 192 176 175 95 136 199 116 165214 95 158 83 137 80 138 151 187 126 196 134 206 137214 95 158
12、 83 137 80 138 151 187 126 196 134 206 137 98 97 129 143 179 174 159 165 136 108 101 141 148 168 98 97 129 143 179 174 159 165 136 108 101 141 148 168163 176 102 194 145 173 163 176 102 194 145 173 7575 130 149 150 161 155 111 158 130 149 150 161 155 111 158131 189 91 142 140 154 152 163 123 205 149
13、 155 131 209131 189 91 142 140 154 152 163 123 205 149 155 131 209183 97 119 181 149 187 131 215 111 186 118 150 155 197183 97 119 181 149 187 131 215 111 186 118 150 155 197116 116 254254 239 160 172 179 151 198 124 179 135 184 168 169 239 160 172 179 151 198 124 179 135 184 168 169173 181 188 211
14、197 175 122 151 171 166 175 143 190 213173 181 188 211 197 175 122 151 171 166 175 143 190 213192 231 163 159 158 159 177 147 194 227 141 169 124 159192 231 163 159 158 159 177 147 194 227 141 169 124 159 (一)次数分布表(一)次数分布表 (1)求全距求全距 全距全距是资料中最大值与最小值之差,又称为是资料中最大值与最小值之差,又称为极极差差,用,用R表示。表示。 R = 254 75 = 1
15、79(g)。 (2) 确定组数和组距确定组数和组距组数的多少视样本容量及资料全距的大小而定,一组数的多少视样本容量及资料全距的大小而定,一般以达到既简化资料又不影响反映资料的规律性为般以达到既简化资料又不影响反映资料的规律性为原则。原则。(一)次数分布表(一)次数分布表表表2-5 2-5 样本容量与组数样本容量与组数 样本容量样本容量 组组 数数 3060 5 83060 5 8 60100 8 10 60100 8 10 100200 1012 100200 1012 200500 1218 200500 1218 500 500以上以上 18301830(一)次数分布表(一)次数分布表 组
16、组距(距(i i)= = 全距全距/ /组数组数 查表查表2-52-5,取组数为,取组数为1212,则组距为:,则组距为: 组距(组距(i i)= 179/12=14.9= 179/12=14.9(g g) 以以15g15g作为组距。作为组距。 (一)次数分布表(一)次数分布表 (3 3)确定组限和组中值(组值)确定组限和组中值(组值) 1 1)组中值最好是整数或与观察值位数相同;)组中值最好是整数或与观察值位数相同; 2 2)组限要明确,最好比原始资料的数字多一位)组限要明确,最好比原始资料的数字多一位小数。如小数位相同,则小数。如小数位相同,则 “上限不在内上限不在内”; 3 3)组距确定
17、后,先选定第一组的中点值,第一)组距确定后,先选定第一组的中点值,第一组中点值以等于或接近最小观察值为好。组中点值以等于或接近最小观察值为好。 (4 4)把原始资料的各个观察值按分组数列的各)把原始资料的各个观察值按分组数列的各组限归组组限归组(一)次数分布表(一)次数分布表 表表2-42-4中,最小观测值为中,最小观测值为7575,选取,选取7575为第一组的组中为第一组的组中值;因组距为值;因组距为1515,所以,所以 第一组的下限为第一组的下限为75-15/2=67.575-15/2=67.5; 第一组的上限也就是第二组的下限为:第一组的上限也就是第二组的下限为:67.5+15=82.5
18、67.5+15=82.5; 第二组的上限也就是第三组的下限为:第二组的上限也就是第三组的下限为:82.5+15=97.582.5+15=97.5; (一)次数分布表(一)次数分布表 表表2-6 1402-6 140行水稻产量数据的次数分布行水稻产量数据的次数分布表表组组 限限 组中值组中值 (x) 划线计数划线计数 次数(次数( ) 累加次数累加次数67.5 75 2 22 282.5 90 7 997.5 105 7 167 16112.5 120 13 2913 29127.5 135 17 4617 46142.5 150 20 6620 66157.5 165 25 9125 9117
19、2.5 180 21 11221 112187.5 195 13 12513 125202.5 210 9 1349 134217.5 225 3 1373 137232.5 240 2 1392 139 247.5 255 1 1401 140 合计(合计(n) 140 140 3.3.质量性状资料的整理质量性状资料的整理 对于质量性状资料可按性状或属性进行分组,对于质量性状资料可按性状或属性进行分组,分别统计各组的次数,然后制成次数分布表。分别统计各组的次数,然后制成次数分布表。 例如,水稻杂种例如,水稻杂种F F2 2植株米粒性状的分离情况,植株米粒性状的分离情况,见表见表2-72-7。
20、(一)次数分布表(一)次数分布表表表2-7 2-7 水稻杂种水稻杂种F F2 2植株米粒性状分离情况植株米粒性状分离情况 性状分组性状分组 次数(次数( ) 频率(频率(% %) 红米非糯红米非糯 96 5496 54 红米糯稻红米糯稻 37 2137 21 白米非糯白米非糯 31 1731 17 白米糯稻白米糯稻 15 815 8 合合 计计 179 100179 100(一)次数分布表(一)次数分布表 (二)次数分布图(二)次数分布图 1.1.方柱形图方柱形图 适用连续性变数适用连续性变数 2.2.多边形图多边形图 适用连续性变数适用连续性变数 3. 3. 条形图条形图 适用间断性变数和属
21、性变数适用间断性变数和属性变数 4. 4. 饼图饼图 适用间断性变数和属性变数适用间断性变数和属性变数方柱形图方柱形图适合于连续性适合于连续性变数资料变数资料 (二)次数分布图(二)次数分布图多边形图多边形图适合于连续性变数资料 (二)次数分布图(二)次数分布图饼图饼图适合于间断性适合于间断性变数和属性资料变数和属性资料 (二)次数分布图(二)次数分布图条形图条形图适合于间断性适合于间断性变数和属性资料变数和属性资料 (二)次数分布图(二)次数分布图 第三第三节节 资料的描述资料的描述 一、平均数平均数 (一)平均数的意义:(一)平均数的意义:平均数是数据的代表值,表示资料中观察值的平均数是数
22、据的代表值,表示资料中观察值的中心位置。是表示资料集中性的特征数。可作为中心位置。是表示资料集中性的特征数。可作为资料代表与另一组资料相比较。资料代表与另一组资料相比较。 (二)平均数的种类(二)平均数的种类1.1.算术平均数算术平均数 121niniyyyyyynnn0 1 2 3 4 5 6 7 8 9 10平均数平均数 = 5平均数平均数 = 6 1 2 3 4 5 6 7 14一、平均数一、平均数 2.中数:又名中位数,是指将所得资料从大到小中数:又名中位数,是指将所得资料从大到小排序,居中间位置的观察值称为中数,记作排序,居中间位置的观察值称为中数,记作Md。0 1 2 3 4 5
23、6 7 8 9 100 1 2 3 4 5 6 7 8 9 10 12 14 中位数中位数= 5中位数中位数= 5(二)平均数的种类(二)平均数的种类 3.几何平均数几何平均数 :n 个观测值相乘之积开个观测值相乘之积开 n 次方所得的次方所得的方根,称为几何平均数,记为方根,称为几何平均数,记为G。其计算公式如下:。其计算公式如下:nnnnyyyyyyG12121)((二)平均数的种类(二)平均数的种类4.众数:是指资料中最常见的一数或次数最多一组的众数:是指资料中最常见的一数或次数最多一组的中点值。计作中点值。计作M0即出现频率最大即出现频率最大 众数可能不存在众数可能不存在 可能有多个众
24、数可能有多个众数 多用于属性数据多用于属性数据0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 众数众数 = 9没有众数没有众数(二)平均数的种类(二)平均数的种类 直接法直接法 加权法加权法 (四)算术平均数的重要特性(四)算术平均数的重要特性 1.1.离均差的总和等于离均差的总和等于0 0iiifyfy/nynynyyyyniin121)()()()(21yyyyyyyyn0)()(21ynyyyynyynyynyyyn(三)算术平均数的计算方法(三)算术平均数的计算方法 (四)算术平均数的重要特性(四)算术平均数的重要特性2.离均差的平方和最小离均差的平方和最小222
25、222)()()( 2)()()( )( 2)()()()(aynyyayyyayayyyyyayyyay222)()()(aynyyay二、变异数二、变异数 变异数变异数:用来反映平均数代表性的优劣。常用用来反映平均数代表性的优劣。常用的有极差、方差、标准差和变异系数。的有极差、方差、标准差和变异系数。 反映反映资料中离散性的特征数。资料中离散性的特征数。资料中最大观察值与最小观察值的差数。用资料中最大观察值与最小观察值的差数。用“R”R”来来表示。表示。例如调查两个不同品种的小麦每穗小穗数,每品种计例如调查两个不同品种的小麦每穗小穗数,每品种计1010个数,经过整理其观察值为个数,经过整理
26、其观察值为 品品种种名名称称 每穗小穗数每穗小穗数总总和和平平均均甲甲13131414151517171818181819192121222223231801801818乙乙16161616171718181818181818181919202020201801801818甲甲乙乙(一)极差(全距)(一)极差(全距)(二)方差(二)方差n1.平方和平方和n离均差的平方和离均差的平方和,简称,简称平方和平方和,记作,记作 SS 。n2.离均差平方和的平均数离均差平方和的平均数21()niissyynyy/)(2 用统计数用统计数 表示资料所有观测值表示资料所有观测值的总变异程度。的总变异程度。 2() /(1)xxn22()(1)xxSn2S 统计数统计数 称为称为均方均方(缩写为(缩写为MS),又称),又称样本方差样本方差,记为,记为S2,即,即2() /(1)xxn(二)方差(二)方差 相应的总体参数叫相应的总体参数叫总体方差总体方差,记为,记为2 2。 对于含有对于含有N N个个体的有限总体而言,个个
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2026年深圳市福田区景莲幼儿园招聘备考题库及一套完整答案详解
- 2026年泸州市龙马潭区人民医院招聘工作人员5人备考题库及完整答案详解1套
- 中共桑植县委组织部2026年公开选调工作人员备考题库附答案详解
- 2026年隆平生物技术(海南)有限公司招聘备考题库及参考答案详解1套
- 2026年洛阳绿业备考题库中等专业学校招聘教师49人备考题库及完整答案详解1套
- 2026年重庆联交所集团所属单位招聘备考题库及一套参考答案详解
- 2026年牛头山水利建设发展有限公司公开招聘临时用工人员备考题库参考答案详解
- 中学班级管理制度完善
- 养老院入住老人医疗保健制度
- 中国热带农业科学院热带作物品种资源研究所2026年第一批公开招聘工作人员备考题库及答案详解参考
- 康复护理学:功能训练与辅助器具使用
- 医疗质量管理的风险预警系统构建策略研究报告
- 2、公安检查站治安管控系统解决方案
- 停车场电车起火应急预案
- 2026共青团中央所属单位高校毕业生招聘66人考试笔试模拟试题及答案解析
- 2025年秋人教版小学四年级数学上册思维训练试题(含答案解析)
- 脑小血管病课件
- 纪检监察证据标准课件
- 2025年四川蜀道高速公路集团有限公司招聘工作人员考试笔试备考题库及答案
- 上海落户业务培训
- 2025年国家开放大学(电大)《中国法律史》期末考试复习题库及答案解析
评论
0/150
提交评论