环境统计第二章_第1页
环境统计第二章_第2页
环境统计第二章_第3页
环境统计第二章_第4页
环境统计第二章_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、1.总体与样本 统计学中,把性质相同的研究对象的所有观测结果的集合称为总体(population)。总体又分为无限总体和有限总体。 在实际工作中,常常是从被研究的总体中随机抽取部分观测结果进行研究。每个部分观测结果的集合称为样本。 从总体中随机抽取样本用以推断总体的方法称为抽样研究。 第二章 环境统计资料的数量分布特征2. 参数与统计量 统计指标 统计学中,把根据规定的函数关系计算出的描述总体或样本特征的函数值称为统计指标(index)。 参数 由总体资料计算出的统计指标称为参数(parameter),用于描述总体特征。 统计量 由样本资料计算出的统计指标称为统计量(statistic),用于

2、描述样本特征 。参数如总体均数、总体方差等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。统计量(statistic)是指样本的统计指标,如样本均数、样本方差等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 平均数平均数统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数被广泛用来描述或比较各种技术措施的效果、某些数量性状的指标等等。平均数主要包括有算术平均数(arithmetic mean)、中位数(median)、众数(mode)、几何平

3、均数(geometric mean)及调和平均数(harmonic mean) 平均数:平均数:算术平均数算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均值,记为 。算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。(一)直接法(一)直接法 主要用于样本含量n30以下、未经分组资料平均数的计算。设某一资料包含n个观测值:x1、x2、xn,则样本平均数 可通过下式计算:nxnxxxxniin121nxx= 平均数:平均数:算术平均数某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、600、480、510、505、490(kg),求其

4、平均体重。由于x=500+520+535+560+585+600+480+510+505+490=5285,n=10.5(kg)528105285nxx 平均数:平均数:算术平均数(二)加权法(二)加权法 对于样本含量n30以上且已分组的资料,可以在次数分布表的基础上采用加权法计算平均数:ffxfxffffxfxfxfxkiikiiikkk11212211 平均数:平均数:算术平均数:(二)加权法(二)加权法将100头长白母猪的仔猪一月窝重(单位:kg)资料整理成次数分布表如下,求其加权数平均数。)(2 .451004520kgffxx 平均数:平均数:算术平均数:(二)加权法(二)加权法计算

5、若干个来自同一总体的样本平均数的平均数时,如果样本含量不等,也应采用加权法计算。某牛群有黑白花奶牛1500头,其平均体重为750 kg,而另一牛群有黑白花奶牛1200头,平均体重为725 kg,如果将这两个牛群混合在一起,其混合后平均体重为多少?)(89.738270012007251500750kgffxx 平均数:平均数:算术平均数基本性质1、样本各观测值与平均数之差的和为零,即离均差之和等于零。2、样本各观测值与平均数之差的平方和为最小,即离均差平方和为最小。 几何平均数调和平均数。上述五种平均数,最常用的是算术平均数。 反映数据变异程度大小的变异指标反映数据变异程度大小的变异指标用平均

6、数作为样本的代表,其代表性的强弱受样本资料中各观测值变异程度的影响。如果各观测值变异小,则平均数对样本的代表性强;如果各观测值变异大,则平均数代表性弱。因而仅用平均数对一个资料的特征作统计描述是不全面的,还需引入一个表示资料中观测值变异程度大小的统计量。变异指标的应用亦根据资料的不同而选取不同指标进行描述。常用的变异指标有极差、四分位极差、四分位数间距、方差、标准差和变异系数数间距、方差、标准差和变异系数,尤其是方差和标准差更为常用。 极差极差极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。全距(极差)是表示资料中各观测值变异程度大小最简便的统计量

7、。全距大,则资料中各观测值变异程度大,全距小,则资料中各观测值变异程度小。但是全距只利用了资料中的最大值和最小值,并不能准确表达资料中各观测值的变异程度,比较粗略。当资料很多而又要迅速对资料的变异程度作出判断时,可以利用全距这个统计量。 百分位数与四分位数间距 百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。 百分位数用Px 表示,0 x 100,如25%位数表示为P25。 四分位数间距(inter-quartile range)是由第3 四分位数(Q3= P75)和第1 四分位数(Q1= P25)相减计算而得,常与中位数一起使用,描述偏态常与

8、中位数一起使用,描述偏态分布资料的分布特征分布资料的分布特征,比极差稳定。其计算公式:QR=Q3-Q1 标准差标准差的意义为了准确地表示样本内各个观测值的变异程度,人们首先会考虑到以平均数为标准,求出各个观测值与平均数的离差,即( ),称为离均差。虽然离均差能表达一个观测值偏离平均数的性质和程度,但因为离均差有正、有负,离均差之和为零,即( )=0,因而不能用离均差之和( )来表示资料中所有观测值的总偏离程度。xxxxxx 标准差标准差的意义为了解决离均差有正、有负,离均差之和为零的问题,可先求离均差的绝对值并将各离均差绝对值之和除以观测值n求得平均绝对离差,即| |/n。虽然平均绝对离差可以

9、表示资料中各观测值的变异程度,但由于平均绝对离差包含绝对值符号,使用很不方便,在统计学中未被采用。xx 标准差将离均差平方,来解决离均差有正、有负,离均差之和为零的问题。将各个离均差平方,即 ( )2,再求离均差平方和,即 ,简称平方和,记为SS;由于离差平方和常随样本大小而改变,为了消除样本大小的影响,用平方和除以样本大小,即 ,求出离均差平方和的平均数;为了使所得的统计量是相应总体参数的无偏估计量,统计学证明,在求离均差平方和的平均数时,分母不用样本含量n,而用自由度n-1,于是,采用统计量 表示资料的变异程度。xx2)(xxnxx/)(21/)(2nxx统计量 称为均方(mean squ

10、are缩写为MS),又称样本方差,记为S2,即S2=相应的总体参数叫总体方差,记为2。对于有限总体而言,2的计算公式为: 2 )2/N 统计学上把样本方差S2的平方根叫做样本标准差,记为S,即:1/)(2nxx1/)(2nxxx(1)(2nxxS 标准差)2()(222xxxxxx222xnxxx222)()(2nxnnxxnxx22)(12)(2nxSnx1)(2nxxS 标准差相应的总体参数叫总体标准差,记为。对于有限总体而言,的计算公式为:=在统计学中,常用样本标准差S估计总体标准差。Nx/)(2 标准差标准差的计算方法(一)直接法 对于未分组或小样本资料,可直接利用公式来计算标准差。计

11、算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550,600,600,650(g)的标准差。 标准差标准差的计算方法(一)直接法 对于未分组或小样本资料,可直接利用公式来计算标准差。计算10只辽宁绒山羊产绒量:450,450,500,500,500,550,550,550,600,600,650(g)的标准差。n=10,经计算得:x=5400,x2=2955000,828.6511010/540029550001/)(222nnxxS 标准差标准差的计算方法(二)加权法 对于已制成次数分布表的大样本资料,可利用次数分布表,采用加权法计算标准差。式中,f为各组

12、次数;x为各组的组中值;f = n为总次数。 1/)(1)(222fffxfxfxxfS7 参数和统计量 标准差5524. 31200200/1 .1070511.5755071/)(222fffxfxS 标准差的特性(1)标准差的大小,受资料中每个观测值的影响,如观测值间变异大,求得的标准差也大,反之则小。(2)在计算标准差时,在各观测值加上或减去一个常数,其数值不变。(3)当每个观测值乘以或除以一个常数a,则所得的标准差是原来标准差的a倍或1/a倍。(4)在资料服从正态分布的条件下,资料中约有68.26%的观测值在平均数左右一倍标准差( S)范围内;约有95.43%的观测值在平均数左右两倍

13、标准差( 2S)范围内;约有99.73%的观测值在平均数左右三倍标准差( 3S)范围内。也就是说全距近似地等于6倍标准差,可用( )粗略估计标准差。xxx6/全距 变异系数当进行两个或多个资料变异程度的比较时,如果度量单位与平均数相同,可以直接利用标准差来比较。如果单位和(或)平均数不同时,比较其变异程度就不能采用标准差,而需采用标准差与平均数的比值(相对值)来比较。标准差与平均数的比值称为变异系数,记为CV。变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 标准差经验法则若一个数据集有近似丘形的对称分布,则可以用以下经验法描述数据集:1大约有68%的测量值位于均值的

14、1个标准差范围内;2大约95%的测量值位于均值的2个标准差范围内;3几乎所有的测量值位于均值的3个标准差范围内。 标准差切比雪夫法则可用于任意数据集,无论数据的频数分布是什么形状。1可能有很少的观察值落在平均值的1个标准差范围内;2至少有3/4的测量值落在平均值的2个标准差范围内;3至少有8/9的测量值落在平均数的3个标准差范围内;4通常,对于任意大于1的数k,至少有(1-1/k2)的测量值落在平均数k个标准差范围内。 变异系数已知某良种猪场长白成年母猪平均体重为190kg,标准差为10.5kg,而大约克成年母猪平均体重为196kg,标准差为8.5kg,试问两个品种的成年母猪,那一个体重变异程度大。%100 xSVC%53. 5%1001905 .10VC%34. 4%100

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论