生物统计学教学案_第1页
生物统计学教学案_第2页
生物统计学教学案_第3页
生物统计学教学案_第4页
生物统计学教学案_第5页
已阅读5页,还剩8页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、完美格式.编辑生物统计学教案第一章统计数据的收集和整理教学时间:2学时教学方法:课堂板书讲授教学目的:重点掌握样本特征数平均数、样本方差、标准差的概念和计算方法,掌 握数据类型及频数(率)分布,了解众数、中位数、变异系数。讲授难点:样本方差、标准差的概念和计算方法1.1 总体与样本1.1.1 统计数据的不齐性1 、变异性是自然界存在的客观规律。2 、自然界如果没有变异,也就不需要统计学了。3、生物学研究的对象都是很大的群体,不可能研究全部对象,只能通过研究其中的一部分,来推断全部对象,于是引出以下概念。1.1.2 总体与样本总体:研究的全部对象。个体:总体中的每个成员。样本:总体的一部分。样本

2、含量:样本所包含的个体数目。1.1.3 抽样抽样:从总体中获得样本的过程。随机抽样:总体中的每一个个体被抽中的机会都相同的一种抽样方法。放回式抽样:从总体中抽出一个个体,记下其特征后,放回原总体中,再做 第二次抽样。非放回式抽样:从总体中抽出个体后,不再放回,即做第二次抽样。抽样的目的:从总体中获得一个有代表性的样本,以便通过样本推断总体。应注意的问题:样本必须有代表性。样本含量与可实施性之间的平衡。1.2数据类型及频数(率)分布1.2.1 连续型数据和离散型数据连续型数据:与某种标准比较所得到的数据。又称为度量数据。离散型数据:由记录不同类别个体的数目所得到的数据。又称为计数数据1.2.2

3、频数(率)分布表和频数(率)分布图的编绘例1.1调查每天出生的10名新生儿中体重超过3公斤的人数,共调查120天,结果如下:表11每10名新生儿中体重超过3Kg的人数的频数(率)分布表组值频数计算频数须率0000.000000.000000.000110.008T20.0175正正T120.1006正正正不190J587正正正正正正正F390.3258正正正正正正语340.2839正正100.0831030.025总计1200.999频数(率)分布:把频数(率)按组值的顺序排列起来,便得到离散型数据的 频数(率)分布。图1 1每10名新生儿中体重超过3Kg的人数的频数分布图 卜面介绍连续型数据

4、的频数(率)分布表和分布图的编绘方法。例1.2 表1-2列出了高粱“三尺三”提纯时所调查的100个数据。表12“三尺三”株高测量结果155153159155150159157159151152159158153153144156150157160150150150160156160155160151157155159161156141156145156153158161157149153153155162154152162155161159161156162151152154157162158155153151157156153147158155148163156163154158152163

5、158154164155156158164148164154157165158166154154157167157159170158从上表中除可以看出最大值为170,最小值为141,以及平均高度大约在150-160之外,很难再看出什么规律出来。但将以上数据列成频数分布表以后,便 可以清楚地看出数据的变化规律。表13 “三尺三”株高频数(率)分布表组限 组界 中值频数计算频数频率141-143 140.5-143.5 143146 143,5-146.5 147-149 146sl49.5 150 152 149.5-152.5 153 155 152.5-155.5 156-158 155.5

6、158.5 159-161 158.5161.5 162 164 161.5-164.5 165 167 164.5-167.5 168-170 167.5170.5总计r了正正正下正正正正正正正正一 .1语正正正正正正一258147036944455566661 1 1 11111111243385031 O12X11 O1243385031 O0.0仙o.og 8O.2OJOJO.OO.O1.0频数(率)分布:把频数(率)按组界的顺序排列起来,便得到了连续型数据 的频数(率)分布。从频数分布表中可见到的规律性:1 、植株矮的频数低,植株高的频数也低,植株中等高度的频数最高。2、频数分布基本

7、是两侧对称的。3、植株平均高度在156-158厘米范围内。编制连续型数据频数(率)分布表的要点:1、求出极差R, R = max x - min x,根据极差决定划分的组数,一般以 10 - 15组为宜。2、根据极差和组数求出组距,按照组距划分组限。组限是按实验记录数据 划分的每一组的上下限。3、确定组界,组界是每一组实际值的上下界。4、计算中值,中值是每一组组限的平均值。5、以唱票的方式把原始数据添入相应的组限内,统计出每组的频数并计算 出相应的频率。连续型数据的频率分布同样可以用频数 (率)分布图表示。下面是频数(率) 分布的直方图。图12“三尺三”株高直方图横轴表明组界,纵轴标明频数(率

8、),以每一组的组界为一边,相应的频数(率)专业.资料整理为另一边,作成连续的矩形,构成直方图。连续型数据的频数(率)分布还可以用多边形图表示。图13“三尺三”株高多边形图横轴为中值,纵轴为频数(率),标上各点,连接各点构成多边形图。第三种频数(率)图是累积频数图。首先编制出累积频数(率)表。再以横 轴为中值,纵轴为频数(率)绘图。表14 “三尺三”株高的累计频数分布表中值累积频数(率)中值累积频数(率)142115771145316086148716396151201669915443169100图1 4“三尺三”株高累计频数分布图1.2.3研究频数(率)分布的意义1 、可以描述数据的集中点,

9、以平均值表示。2、可以描述数据变异的情况。3、可以描述数据分布的形状。4、可以显示数据中的不规则的情况。1.2.4频数(率)分布的不恒定性频数(率)分布是样本分布,由于不同次抽样的随机误差,造成样本间的波 动。见下例。表1-5 每10名行人中男性人数分布表"1"2男性人数频数男性人数频数01001211292631731842742554654062963071272084899391100100总计1501501.3样本的几个特征数样本特征数:描述样本分布特征的数字。如,平均数、标准差、偏斜度和峭 度。1.3.1平均数我们在这里使用的是算术平均数,以后一律简称为平均数。平

10、均数以 x表 示,读作“ X杠”或“杠X”。计算公式如下:nXi Xi X2Xn i=1X 二二nn(1.1)第二种平均数称为中位数,中位数是有序数列中点位置上的数。第三种平均数是众数,所谓众数是指具有最高频数的组值或中值。1.3.2平均数的计算方法1、非频数资料:非频数资料可以直接使用(1.1)式计算,不再举例。2、频数资料:计算离散型数据的频数资料时,可用下式:“fxi =1i其中:X以下计算例1.1x -N=组值,f =频数, 的平均数。根据表N =1 -(1.2)总频数,k二组数1中的数据,列成卜表。Xffx000100200313428512606191147392738342729

11、109010330总计120850由公式(1.2 )得k850120=7.08' fx ii =1X 二N每10名新生儿中,平均有7名体重超过3公斤。计算连续型数据的频数资料时,与离散型数据类似。只要用连续型数据的中 值代替离散型数据的组值即可,这里不再举例。1.3.3 标准差可以用三个量来度量数据的离散程度。1、范围:又称为极差,它是一组数据的最大值与最小值的差。例如,以下 5 个数:96.4、96.6、97.2、97.4、97.8 (ml)。它们的范围(R)R = 97.8 96.4 = 1.4 ml优点:简单。缺点:只利用了一组数据的两个极端值,不能客观地反映一组数据中每一个 数

12、据与平均数的偏离程度。为了解决范围所存在的缺点,需要求出一组数据中的每一个数与平均数的离 差,然后再对该离差进行平均,以其平均数反映数据的离散程度。2、平均离差:先看下表x ml离均差X- X mlml X 一 X 2 ml 296.6-0.480.480.230497.2+0.120.120.014496.4-0.680.680.462497.4+0.320.320.102497.8+0.720.720.5184X97 . 08=0=2.32和=1.3280为了求得离均差的平均数,首先要求离均差的和,从表中可见离均差的和为 00为了解决负数问题,求离均差绝对值的和,再以样本含量平均,从而得出

13、平均离差(MD。MDxx 2.320.464 ml3、标准差:解决负数的问题除取绝对值外,另一个办法是取离均差的平方。所有离均差的平方相加称为离差平方和。按习惯做法,应当用样本含量n平均,但在这s2。里不用n而用n - 1平均,所得结果称为样本方差,记为n% xi - X 2 i =1(1.3)上例中的方差1.32805 - 10.332ml 2方差的单位是原始数据的平方,为了使单位与原始数据相同,还必须对方差开方,开放后的方差称为标准差,记为n“ Xii =1n(1.4)上例的标准差为J0.3320.576 ml抽样理论证明,三种对总体离散程度估计的方法中,标准差估计得最可靠, 以后我们一律

14、使用标准差。1.3.4 标准差的计算方法1 、非频数资料由1.4式计算标准差首先要计算出平均数,给计算带来一定的困难也影响结果的准确性。可将1.4式变为以下形式XiJ、2n2Xii =1(1.5)例1.3 计算以下数据的标准差:26 25 28 24 23 25 27 27 30 21解最好列成以下表格的形式计算26252824232527273021676625784576529625729729900441将最后一行代入1.5式s25610 9、6.712.59和 2566614如果对上表中的数字进行编码,则计算更为简便。取C=2600- 1124- 24- 39- 111111416-525和-462将上表中的最后一行代入1.5式中,得s = 2.59。与未编码的结果一样。2、频数资料k|Z (fx)i=11离散型数据可按下式计算k(1.6)'、f X2 i - i =1N i 1其中,f =频数,x =组值,N =总频数,k =组数。对于连续型数据,只需将1.6式中的组值x,改为中值mi 一般m的值都较 大,需对m进行编码后再计算。对于频数资料的计算不再举例,同学可用例 1.1和例1.2的数据为例进行练 习。1.3.6变异系数标准差可以反映数据的离散程度,如果在两个样本之间进行比较,还要考虑

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论