第三章统计假设检验_第1页
第三章统计假设检验_第2页
第三章统计假设检验_第3页
第三章统计假设检验_第4页
第三章统计假设检验_第5页
已阅读5页,还剩54页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

§

2样本平均数的假设检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。即检验无效假设H0:μ=μ0,备择假设HA:μ≠μ0或μ>μ0(μ<μ0)的问题。已知的总体平均数一般为一些公认的理论数值、经验数值或期望数值。常用的检验方法有u检验和t检验。下一张

主页

退出

上一张

2.1单个样本平均数的假设检验实质是样本所在总体平均数与已知总体平均数差异显著性检验。2.1.1单个样本平均数的u检验

u检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Ztest)。由抽样分布理论可知,有两种情况的资料可以用u检验方法进行分析:样本资料服从正态分布N(μ,σ2),并且总体方差σ2已知;总体方差虽然未知,但样本平均数来自于大样本(n≥30)。下边举例说明检验过程:【例2-2】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?由题意知,样本服从正态分布,总体方差σ2=64,符合u检验应用条件。由于当日装罐机的每罐平均净重可能高于或低于正常工作状态下的标准净重,故需作两尾检验。其方法如下:(1)提出假设。无效假设H0:μ=μ0=500g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:μ≠μ0,即罐装机工作不正常。(2)构造统计量,并计算样本统计量值。均数标准误:样本平均数:统计量u值:(4)统计推断。由显著水平α=0.05,查附表,得临界值u0.05=1.96。实际计算出的表明,试验表面效应仅由误差引起的概率P>0.05,故不能否定H0

,所以,当日装罐机工作正常。(3)确定显著水平。α=0.05(两尾概率)下一张

主页

退出

上一张

2.1.2单个样本平均数的t检验

t检验(t-test)是利用t分布来进行统计量的概率计算的假设检验方法。它主要应用于总体方差未知时的小样本资料(n<30)。其中,为样本平均数,S为样本标准差,n为样本容量。例2-3

用山楂加工果冻,传统工艺平均每100g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为=520g,标准差S=12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?本例总体方差未知,又是小样本,采用双侧t检验。

(1)提出无效假设与备择假设,即新老工艺没有差异。

,新老工艺有差异。下一张

主页

退出

上一张

(2)计算t值=520g,S=12g所以(3)确定显著水平α=0.01(4)查临界t值,作出统计推断由=15,查t值表(附表3)得t0.01(15)=2.947,因为|t|>t0.01,P<0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。(在统计量t上标记**)下一张

主页

退出

上一张

【例2-4】某名优绿茶含水量标准为不超过5.5%。现有一批该绿茶,从中随机抽出8个样品测定其含水量,平均含水量=5.6%,标准差S=0.3%。问该批绿茶的含水量是否超标?符合t检验条件,为单尾检验。(1)提出无效假设与备择假设

H0:≤

=5.5%,HA:>(2)计算t

下一张

主页

退出

上一张

(3)查临界t值,作出统计推断

单侧=双侧=1.895,t=1.000<单侧t0.05(7),P>0.05,不能否定H0

:≤

=5.5%,可以认为该批绿茶的含水量符合规定要求。下一张

主页

退出

上一张

【例】按饲料配方规定,每1000kg某种饲料中维生素C大于246g,现从工厂的产品中随机抽测12个样品,测得维生素C含量如下:255、260、262、248、244、245、250、238、246、248、258、270g/1000kg,若样品的维生素C含量服从正态分布,问此产品是否符合规定要求?下一张

主页

退出

上一张

按题意,此例应采用单侧检验。

(1)提出无效假设与备择假设

H0:≤

246,HA:>246

(2)计算t

值经计算得:=114.5,S=1.581下一张

主页

退出

上一张

所以

===2.281

3、查临界t值,作出统计推断

因为单侧=双侧=1.796,t=2.281>单侧t0.05(11),P<0.05,否定H0

246,接受HA

:>246,可以认为该批饲料维生素C含量符合规定要求。下一张

主页

退出

上一张

在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。比如两个果实品种的比较,两种检验方法的比较,两种加工方法的比较等。2.2两个样本平均数的假设检验对于两样本平均数差异显著性检验,因试验设计不同,一般可分为两种情况:

一、成组资料的平均数比较二、成对资料的平均数比较

2.2.1成组资料的平均数比较当一个试验只有两个处理的时,将试验全部单元完全随机地分为两组,对两组随机地分别实施不同的处理。得到的两组数据即为成组资料。(各组的单元数亦即重复数可以相等也可以不等)成组资料的一般形式见下表。

成组资料的一般形式成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等成组资料两样本平均数差异显著性检验的基本步骤如下:1、做出统计假设。2、在无效假设条件下构造合适的统计量。(1)U检验:若两个总体方差均已知,或者未知但均为大样本。~N(0,1)若方差未知,则用代替(2)t检验:两个样本所在总体方差均未知,且又是小样本。此时H0成立条件下:~t(n1+n2-2)3、确定显著水平,查临界值。4、做出统计推断。例,某家禽研究所对粤黄鸡进行饲养对比试验,试验时间为60天,增重结果如下表,问两种饲料对粤黄鸡的增重效果有无显著差异?【例】现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量,结果见表

。问两种工艺的粗提物中茶多糖含量有无差异?醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超滤法(x2)29.3228.1528.0028.5829.00表

两种工艺粗提物中茶多糖含量测定结果(1)建立假设,提出无效假设与备择假设,两种工艺的粗提物中茶多糖含量无差异;(2)计算因两个样本的容量不等,所以下一张

主页

退出

上一张

(4)查临界t值,作出统计推断

当df=9时,查临界值得:t0.05(9)=2.262,|t|=1.380<t0.05(9)

,所以P>0.05,接受,表明两种工艺的粗提物中茶多糖含量无显著差异。(3)确定显著水平α=0.05(两尾概率)

2.2.2成对资料两样本平均数的差异显著性检验

成组设计要求试验单位尽可能一致。如果试验单位变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单元不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。

配对设计是先将试验单位两两配对,然后将配成对子的两个试验单位随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单位的初始条件尽量一致,不同对子间试验单位的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。配对设计是指先根据配对的要求将试验单元两两配对,然后将配成对子的两个试验单元随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单元的初始条件尽量一致,不同对子间试验单元的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。下一张

主页

退出

上一张

1.自身配对:指在同一试验单元进行处理前与处理后的对比,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测某种病畜治疗前后临床检查结果的变化;观测用两种不同方法对畜产品中毒物或药物残留量的测定结果变化等。同一食品在贮藏前后的变化。下一张

主页

退出

上一张

2.同源配对:指将非处理条件相近的两个试验单元组成对子,然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理。配对试验加强了配对处理间的试验控制(非处理条件高度一致),使处理间可比性增强,试验误差降低,因而,试验精度较高。

成对资料与成组资料相比,成对资料中的两个处理间的数据不是相互独立的,而是存在某种联系。配对设计试验资料的一般形式见下表

。配对设计试验资料的一般形式非配对设计(成组)资料的一般形式

配对设计两样本平均数差异显著性检验的基本步骤如下:

(一)做出统计假设,其中为两样本配对数据差值d总体平均数,它等于两样本所属总体平均数与之差,即=-。所设无效假设、备择假设相当于,。

(二)计算t值计算公式为

(5-6)式中,为差异标准误,计算公式为:

(5-7)

d为两样本各对数据之差

Sd为d的标准差;n为配对的对子数,即试验的重复数。

(三)查临界t值,作出统计推断根据df=n-1查临界t值:t0.05(n-1)和t0.01(n-1),将计算所得t值的绝对值与其比较,作出推断。【例

为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表4-5。问电渗处理对草莓钙离子含量是否有影响?本例因每个品种实施了一对处理,试验资料为成对资料。品种编号12345678910电渗处理X1/mg22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照X2/mg18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d=X1-X2)4.193.103.615.003.081.995.921.712.444.14表4-5电渗处理对草莓钙离子含量的影响,即电渗处理后草莓钙离子含量与对照钙离子含量无差异,也就是说电渗处理对草莓钙离子含量无影响。下一张

主页

退出

上一张

(1)建立假设

(2)计算将计算所得t值的绝对值与临界值比较,(4)查临界t值,作出统计推断根据df=n-1=9,查临界t值:t0.01(9)=3.250因为|t|=8.358>t0.01(9),P<0.01,否定H0,接受HA

,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。

(3)确定显著水平α=0.01例,用家兔10只试验某批注射液对体温的影响,测定每只家兔注射前后的体温,见表。设体温服从正态分布,问注射前后体温有无显著差异?

【例】现从8窝仔猪中每窝选出性别相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间30天,试验结果见表。问两种饲料喂饲仔猪增重有无显著差异?(同源配对)

§3

参数估计参数估计是统计推断的另一重要内容。研究一事物,总希望了解其总体特征。描述总体特征的数我们说称为参数。然而,总体参数往往无法直接求得,都是由样本统计量来估计的。点估计:将样本统计量直接作为总体相应参数估计值的估计方法。在前面统计假设检验方法的学习中,我们以以样本平均数估计总体平均数μ,用样本方差来估计总体方差。点估计只给出了未知参数估计值的大小,没有考虑试验误差的影响,也没有指出估计的可靠程度。

区间估计:在一定的概率保证下,由样本统计量估计出总体参数可能取值的区间。这个区间称为置信区间。区间的上、下限称为置信上、下限,一般用L1表示置信下限

、L2表示置信上限。保证参数在置信区间内的概率称为置信度或置信概率,以P=1-α表示。描述总体的参数有多种。各种参数的区间估计计算方法有所不同,但基本原理是一致的,都是运用样本统计数的抽样分布来计算相应参数的置信区间的上、下限的。总体平均数μ的区间估计1、利用正态分布进行总体平均数μ的区间估计2、利用t分布进行总体平均数μ的区间估计1、利用正态分布进行总体平均数μ的区间估计已知,估计μ

设总体x~N(μ,),且已知,x1,x2,…,

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论