试验统计方法 第五章假设检验学习资料_第1页
试验统计方法 第五章假设检验学习资料_第2页
试验统计方法 第五章假设检验学习资料_第3页
试验统计方法 第五章假设检验学习资料_第4页
试验统计方法 第五章假设检验学习资料_第5页
已阅读5页,还剩58页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第三节二项资料的百分数假设测验二项分布的次数资料,可以换算成百分数资料。这种现象生物学试验中经常遇到。它们是服从二项分布的。理论上这类百分数的假设测验应按二项分布进行(概率计算公式4-1,P51)。但当样本较大时,计算十分繁琐。

例题:有一批蔬菜种子的平均发芽率p0=0.85。现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,问种衣剂对发芽有没有影响?若按二项分布,其中500粒种子中有445粒发芽的概率为:另外还需进行更多类似的计算!但当样本含量n较大、不过大过小时,二项分布接近于正态分布。所以,对于服从二项分布的百分数资料,当n足够大时,可以近似地用u测验法。

一个样本百分数的假设测验是检验一个样本百分数所在二项总体百分数p是否与已知二项总体百分数p0相同,换句话说,检验该样本百分数是否来自总体百分数为p0的二项总体。一、一个样本百分数(成数)的假设测验复习二项资料次数分布

μx=np

二项资料百分数(p)分布。

μp=p

二项分布百分数资料适用于近似u测验所需要的样本含量n(书中表5-6,P83)(样本百分数)n(较小组次数)n(样本容量)0.500.400.300.200.100.051520244060703050802006001400

样本百分数的标准误为样本百分数的标准离差(因样本容量较大,用u测验)

例题:有一批蔬菜种子的平均发芽率p0=0.85。现随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,问种衣剂对发芽有没有影响?分析:已知条件p0=0.85,q0=0.15,

可求出样本种子发芽率:

n=500,,可直接采用u测验。

解:

(1)假设:HO:p=p0=0.85;HA:p≠p0

(2)确定显著水平为α=0.05。两尾测验。(3)计算:样本平均数标准误

(4)推断:u>u0.05=1.96,p<0.05,拒绝H0,认为种衣剂浸种能显著提高种子的发芽率。

二、两个百分数的假设测验通过两个样本百分数,测验它们所属总体p1和p2的差异显著性。若从两个总体中各抽取容量为n1,n2的样本,其中有指定特性的个数为x1,x2

则有:

假设H0:p1=p2成立,两个样本来自同一个总体。可用两百分数的加权平均值

对p1=p2做出估计样本平均数差数的标准误为例题:调查春大豆A的120个豆荚,其中瘪荚38个,瘪荚率31.7%;调查春大豆B的135个豆荚,其中有瘪荚52个,瘪荚率38.5%。试检验两个品种的瘪荚率是否相同?解:已知n1=120,x1=38,=0.317n2=135,x2=52,=0.385

假设H0:p1=p2,HA:p1≠p2

两尾测验,显著水平取0.05,因为均大于30,可用u测验,不需矫正。推断:因为|u|<u0.05,故P>0.05。接受H0,即:两个品种的瘪荚率差异不显著,可以认为两个品种的瘪荚率相同。三、二项样本假设测验的连续性矫正

当样本容量不大(np和nq≤30)时,需做连续性矫正。用矫正tc测验自由度df=n-1一个样本百分数两个样本百分数相比较

式中x1和n1为具有较大pˆ1值的样本式中x2和n2为具有较小pˆ2值的样本自由度为df=n1+n2-2例题:用基因型纯合的糯玉米和非糯玉米杂交,按遗传学原理,预期F1植株上糯性花粉粒的P0=0.5,现在一视野中检视20粒花粉,得糯性花粉8粒,试问此结果和理论结果是否相符?解:求出pˆ=8/20=0.4,qˆ=0.6,

因为n=20,,需进行矫正。

(1)HO:p=p0=0.5;HA:p≠p0

(2)确定显著水平为α=0.05。两尾测验。(3)计算:

df=n-1=20-1=19,查附表4,t0.05=2.093(4)推断:因tc<t0.05

,故接受H0,即实得百分数与理论百分数没有显著差异。原则上,一个样本二项分布百分数的假设检验,均可按二项分布直接求出某种抽样结果的概率。但在样本较大时,计算工作量浩大。1、在当样本容量较大,时,可直接采用u测验。2、当时,需进行矫正,用近似的tc

测验。3、当时,直接用二项分布求概率。第四节参数的区间估计参数的区间估计区间估计与假设测验样本容量与精确度

例题:已知某品种玉米单穗重(g)服从N(300,11.52)。在种植过程中喷洒了某种药剂。欲了解该药剂对玉米穗重是否产生影响,从喷过药的植株上随机选取9个果穗,测得样本单穗重的平均数为307克,标准差为12.3。问题1:测验药剂对玉米穗重是否有影响?即喷洒了某种药剂总体的平均数是否为11.5g。问题2:喷洒了某种药剂总体的平均数为多少?为什么参数估计?参数估计:是用样本统计量来估计总体参数。无偏估计量:如果一个统计量的理论平均数(数学期望)等于总体参数,这个统计量就称为该参数的无偏估计量。点估计(pointestimation):样本统计量直接作为总体相应参数的估计值

点估计只给出了未知参数估计值的大小,没有考虑抽样误差的影响,也没有指出估计的可靠程度。区间估计(intervalestimation)是在一定概率保证下指出总体参数的可能范围。置信区间在一定概率保证下,估计出参数的可能范围。置信度:区间估计的概率保证。置信限:置信区间的上下限。置信限有置信上限L1和置信下限L2。举例说明抽样调查知某学校在校本科生的月平均消费为1000元(点估计)。95%(置信度)的在校本科生的月平均消费在800-1200元之间(置信区间)。因此,区间估计可以提供更多的信息。一、总体平均数的置信区间(一)在总体方差已知时

在总体方差已知,或为大样本时,样本平均数的标准离差呈正态分布。在(1-α)的概率(置信度)下这就是正态分布,置信度为(1-α)下,总体平均数μ的置信区间。解:P=1-α=0.95查附知u0.05=1.96

则纤维长度95%的置信区间为(30–1.96×0.56)

<μ

≤(30+

1.96×0.56)即:28.90mm<μ

≤31.10mm例题:已知某棉花品种纤维长度的标准差为2.5mm。该品种良种繁育田中20个株行的棉花纤维平均长度是30mm,求95%置信度下的置信区间。(二)在总体方差未知时当总体方差未知,且样本较小时,包含n个观测值X1、X2、…、Xn。样本平均数为

样本标准误为

当总体平均数为μ时,服从自由度为n-1的t分布。当两尾概率为α时,有:

也就是说t在区间内取值的概率为1-α,即:

即上式称为总体平均数μ置信度为1-α的置信区间。其中置信半径是:置信下限是置信上限是常用的置信度为95%和99%,故由上式可得总体平均数μ的95%和99%的置信区间如下:

解:当df=7时,t0.05=2.365,代入

例题:某春小麦良种在8个小区的千粒重平均数,s=1.64g。试估计该小麦品种在置信度为95%时的千粒重区间。35.2-2.365×0.58≤μ≤35.2+2.365×0.5833.8≤μ≤36.6

即:该品种千粒重在95%置信度时的区间是

33.8~36.6g二、两总体平均数差数的置信限(一)在两总体方差已知或为大样本时:两样本平均数差数的标准离差双尾概率α=0.05,即置信概率为(1-α)时,

μ1-μ2在1-α置信度下的置信区间为

L1L2式中为平均差数的标准误为uα置信度为1-α时的u临界值例题:测得农选1号甘薯332株的单株产量,x1=750g,s1=265g。白皮白心甘薯282株,x2=600g,s2=185g,试估计两个品种单株产量相差在95%置信度下的置信区间。解:u0.05=1.96因此95%置信限为:L1=(750-600)-1.96×18=114.7(g)L2=(750-600)+1.96×18=185.3(g)即:农选1号品种单株产量比白皮白心品种多114.7~185.7g,这个把握有95%。(二)在两总体方差未知且为小样本时

1、可以假设两总体方差相等时

2、两总体方差不等时。

(三)成对数据总体差数的置信区间估计(略)三、二项总体百分数p的置信区间样本百分数只是总体百分数p

的点估计值。百分数的置信区间则是在一定置信度下对总体百分数作出区间估计。求总体百分数的置信区间有两种方法:正态近似法。查表法正态近似法在资料np和nq>30时,二项分布近似正态分布。所以当样本百分数为pˆ,在置信度为(1-α)下,对总体百分数的p的置信区间估计为(pˆ-uαSpˆ)≤p≤(pˆ+uαSpˆ)式中常用的95%、99%置信区间为:查表法(附表7,p348)根据表中列的容量和某一性状出现的次数(f),可直接查得对应总体p的置信区间。表中列出的是常用的95%和99%的置信区间。例题:调查250株玉米,得到玉米螟危害的为50株,即pˆ

=50/250=0.2。试计算95%置信度的玉米螟危害率置信区间。查表法:在样本容量n=250,观察百分数pˆ

=0.2,可直接查得95%置信度的置信区间为15%~

26%正态近似法:

置信下限:L1=pˆ-uαSpˆ

=0.2-1.96×0.028=14.5置信上限:L2=pˆ+uαSpˆ=0.2+1.96×0.028=25.5四、两个二项总体百分数差数的置信限

在大样本时,置信度为1-α时的置信限(pˆ1-pˆ2)-uα

Spˆ1-pˆ2≤p1-p2≤(pˆ1-pˆ2)+uα

Spˆ1-pˆ2例:调查低洼地小麦锈病率pˆ1=93.92%(n1=378);高坡地小麦锈病率pˆ2=87.37%(n2=396),它们有显著差异,试按95%置信度估计两种环境麦田锈病率相差的置信区间。解:u0.05=1.96

L1=(0.9392-0.8731)-(1.96×0.0208)=0.0254L2=(0.9392-0.8731)+(1.96×0.0208)=0.1068

即低洼地锈病发生率比高坡地高2.54%~10.68%,此估计的置信度为95%。五、区间估计与假设测验置信区间是在一定置信度下(1-α)对总体参数所在范围的估计。若总体参数的假设值落在这个范围内,则这个总体的参数与假设值(往往是已知总体的参数)没有真实不同,因而接受无效假设H0),若落在该区间以外,这个总体的参数与假设值不同,所以否定无效假设H0。区间估计,也可用于假设测验。例题:某地生产上种植的春小麦良种的千粒重μ0=34g。现自外地引入一新品种,在8个小区种植,测得其千粒重(g)分别为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差别?df=n-1=7时,

t0.05

=2.365。

t<t0.05,p>0.05,不显著。35.2-2.365×0.58≤μ≤35.2+2.365×0.5833.8≤μ≤36.6新品种千粒重95%置信区间为:某地生产上种植的春小麦良种的千粒重μ0=34g,位于该区间内,故不显著。例题:测得农选1号甘薯332株的单株产量,x1=750g,s1=265g。白皮白心甘薯282株,x2=600g,s2=185g,试估计两个品种单株产量相差在95%置信度下的置信区间。农选1号品种单株产量比白皮白心品种多114.7~185.7g,这个把握有95%。其区间不包含0,故差异显著。六、样本容量与精确度假设测验不显著,客观上存在两种可能性,一个是两个总体间确无差异存在,另一种可能是两总体间存在差异,但是未能测验出来(β错误)。区间估计可用来做显著性测验,置信区间的大小,表示估计的精确度程度。置信区间越大,精确度越差(β错误的可能性越大)。置信区间越小,精确度越好(β错误的可能性越小)。置信区间的大小,取决于置信半径。增大样本容量,可以降低样本的抽样误差,提高试验的精确度。反过来,也可以根据试验要求的精确度,计算所需的样本容量。当进行一个平均数比较时(设α=0.05):置信半径样本容量

上式是在假设样本容量n>30时估算的,若计算出的n值较小,可再按求出的n值,计算出自由度,查出该自由度下的t0.05,代入公式,直至得出一个稳定的n值,即是所需样本容量。

例题:某地春小麦良种的千粒重μ0=34g,现自外地引入一新品种,在8个小区种植,测得其千粒重(g)为:35.6、37.6、33.4、35.1、32.7、36.8、35.9、34.6,问新引入品种的千粒重与当地良种有无显著差别?(样本平均数为35.2g,标准差s=1.64)

前面已经假设测验,新品种(样本)千粒重平均数为x=35.2g,二者表面相差1.2g,但差异不显著。比较例题:某地春小麦良种的千粒重μ0=34g,标准差为δ=1.64g,现要求与其它品种比较试验时能鉴定出±0.8g的差异,问样本容量应该有多大?解:

n较小,在n=16时,df=16-1=15,查表

t0.05=2.131将t0.05=2.131代入公式,得当df=19-1=18时,t0.05=2.101将t0.05=2.101代入公式,得n稳定在19。即当样本容量为19时,可鉴别出±0.8g的差异。当两个平均数比较时,求所需样本容量。若两个方差相同时,可假定两个样本容量相等,即n1=n2=n,则

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论