




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第三节统计假设检验**Testofstatisticalhypothesis某地当家小麦品种(总体)产量的平均数为每用转和非转两种稻米饲养一月龄大白鼠,组的数据分别为本章主要内容总体间的差异如何比中的所有数据计算出总体参数(如由由样本的结果如何来推断总的原理与方法(一)、假设测验的概假设测验就是根据总体的理论分布和小概率原理,对未知或不完全知道的总体提出两种彼此对立的假设,然后由样本的实际结果,经过一定的计算,作出在一定概率意义上应该接受的那种假设的推断。也称显著性测验(二)、假设检验的步(方法一般应包括以下4个步提出假确定显著确定显著水计算概推断是否接受假1、提出假假设检验首先要对总体提出假设(statistical一般应作两个假设一个是无效假设(nullhypothesis),记作H0;另一个是备择假设(alternativehypothesis),记作HA确定无效假设必须遵循两个原①无效假设是有意义的备择假设(alternativehypothesis)是指试验因此,无效假设与备择假设是对立事件否定H0则接受HA单个平均数的假设测无效假设H0:μ=μ0备择假设HAμμ0两个平均数的假设测无效假设H0:μ1=μ2备择假设HAμ12、确定显著水确定一个否定的概率标准,这个概率标准叫显著水平,记作:。3、计算概假设正确,根据抽样分布计算出由抽样误差造成的概率。u测验或t测验、2检验F检验等概率的大小,是推断概率的大小,是推断是否正确的依据。考虑差异的正和负两个方面时,计算双尾概率。概率计算方法某地小麦品种(总体)产量的平均数每亩的试验,计得其样本平均产量为每亩330kg,那么新品种样本所属总体与μ0=300的当地品种这个总计算概率在假设H0为正确的条件下,根据的抽样分布出获得=330kg的概率,或者说算得出现随机误=30(kg)的概率:在此,根据u测验公式可算得
y0uy330300 小于α=0.05的水平,属于抽样误差的概率小于5%。
y
1.96y}
P{y
α=5%时,区间
)为接假设的区域,简称接受区acceptanceregion)y1.96和y
为否定假设的区域,简称否定(rejectionregion)同理,若以1%作为接受或否定H0的界限,
)为接受区域,y
和y
为否定区域如上述小麦新品种
受 受区否定区域0=300,
151.96
y=29.4(kg)
≤300-29.4≥300+29.4,大于329.4(kg)和小270.6(kg)的概率只有5%
域y5%显著水平假设测验图(表示接受区域和否定区域4、推断是否接受假小概率原理:在假设的条件下能够准确地算出事件(“(“小概率事件实际上不可能发生”)计算的概率大于0.05或0.01,接受H0,同时P≤0.05叫做差异显著(significance)P≤0.01叫做差异极显著标“”表示差异达到显著水平,“**”差异达到极显著水平。(三)、双尾测Two-tailedtestandone-tailed提出无效假设和备择假设,其总体平均数可能大于,也可能小于。两个否定区位于两尾,称为双尾测验单尾测备择假设有两种可单尾测当备择假仅有一种可能,只能考虑左尾或查或分布表时,需将一尾概率乘以,再进行查表。(四)、假设检验中的两类错TypeIerrorandtypeIIα错当否定H0时出这类错误叫第一类错误,或称α错误不过,犯这类错误的概率很小,只0.05或0.01β错误接受H0时出错,是第二类错误,或称β错误
否定区域
受区
否定区域
接受——没犯错正
(第一类错误不正
——犯了错——弃真错否 率以α表示否接受——犯了错误——采伪错误 否定——没犯错误(1)提高显著水平,减少了第I类错误的可能,却增加了第II类错误的可能。ββα(2)增加样本容量,规范试验操作,降低试验误差,减少犯第II类错误的可能。βαβαβαβα例:已知总体的均值0=300,其平均数抽样标准误为被抽样总体的平均数315kg、标准误也为u1
u2
查附表故 =P(u2<0.96)-P(u1<-2.96)=0.8315-0.0015=0.83或 0
H
=300是错误时的是否能够构造检验统计犯两类错误所造成的的严重性差假决假决接受接受接受H0IH0III型错II型错将无效的药物推广使用所造成的比将有效的药物销毁所造成的更严重,应严格控制犯这种错误的概率。统计学本平均数的假设检验(一)u检(二)t检以单个样本平均数的检验为例
t分
2)y样本平均数y的分布必趋向正态分布N(, )y并且u
y
当样本容量不太大(n<30)而
2为未知时,以样均方s
估计
2,则其标准化离
(ys
t分布,具有自由度DF=n-1ty sy
(51)nsy ns为样本标准差,n为样本容量t分布(t-distribution)是1908年W.SGosset的,又叫学生氏分布(students’tdistribution)称密度函数曲线,具有一个单独参数
是自由度。在理论上,当v增大时,tt分布的密度函数πν[(ν2)/πν[(ν2)/
[(ν1)/
(2 2ν
(
(53)t分布的平均数和标准差t
(54) (假定2) 正态分布正态分布t分布t分布曲线是对称的0.40围绕其平均数t
向
较,t分布曲线稍为扁平5.5)。t分布是一组随自由度v而改变的曲线,但
- - 当v>30时接近正态曲线
图 标准化正态分布与自由度为4t分布曲线合一。由于t分布受自由度制约,所以tt分布的概率累积函数
ftdt
(55)和正态概率累积函数一样,t分布的概率累积函数也分一尾表和两尾表。计算t于给定t0值时
t0
f f
tdt因而tt到∞的面积为1-Fv(t),而两尾正态分布正态分布t分布- - 标准化正态分布与t分布曲在t表中,若v相同,则P越大,t越小;P越小,t越大。因此在假设测验时,若算得的|t|<t,则接受无效假设。(一u检σ2未知时,n>30,用S2来代替σ2,仍可复习u分(样本平均数的标准化变量,正态离差u
x xn n例题已知某品种玉米单穗重(g)服N(300,11.52)。在种植过程中喷洒了某种药剂。欲了解该药剂对玉米穗重是否产生影响,从喷过药的植株上随机选取9个果穗,测得样本单穗重的平均数为307克,标准差为12.3。测验药剂对玉米穗重是否有影响?分析解(1)HO:μ=μ0HA:μ(2)显著水平α计算ux307
n9 11.5n9查附表P>0.05,所以接受H0即该药剂对玉米穗重没有影例:生产某种纺织品,要求棉花纤维长度平均 假设H0:μμ0,即该棉花品种纤维长度达不到30.0mm。对HA:μ≥μ0;确定显著水平检验计算推断:单尾检验临界值u0.05=1.645。|u|<1.645,P>0.05,故接受H0,该品种纤维长(二)小样本平均数的假设检验——t检 n<30,σ2未知时,s2与σ2相差较大,u不呈正态分布,而呈自由度为n-1的t分布。以单个样本平均数的t测验为例测验某一样y所属总体平均数是和某一指定的总体平均数相同例题:某地生产上种植的春小麦良种的千36.8、35.9、34.6,问新引入品种的千重与当地良种有无显著差别良种,故用两尾检验解:(1)H0:μμ0=34gHAμ选取显著水平计x
34.6)/8
35.2(gSS(x
x)2
(2
37.62
34.62
/8SSn181s SSn181nsx sn
0.58(g8tx35.28
sx 查附表4,自由度df=n-1=7时t0.05=2.365t<t0.05,p>三、两个样本平均数的假设检验通过两个样本平均数的比较,以测验这两个样本所属的总体平均数有无显著差异。测验方
成组数据的平均数比成对数据的比(先配对(一)成组数据的平均数比成组数据资料两个抽样样本彼此独立成组数据的平均数比较又依两个样本所属的总方差(2和 )是否已知、是否相等而采用不同的测 方法复样本平均数差数的分样本平均数差数分布的平均数x12x12
2样本平均数差数分布的方 2
σ12和σ22为已知时,或总体方差未知但样本平均数差数的标准误2122x2122(x1x2)(x1x2)(12)(x1x2xx u 例:根据多年资料,某杂交黑麦从播种到开花的天数的标准差为,现在干旱(条件下查40株,得出从播种到开花的平均天数为69.5;正常(B条件下0株,得出从播种到开花的平均天数为,试比较两种条件下黑麦从播种到开花的天数有无显著差别。解:总体方差已知,故用u检验;又事先不、所得从播种到开花的天数是否相同,需尾检验。假设H0:μ1=μ2,HAμ1μ2取显著水平α(4)推断:|u|否定HA,干旱(4)推断:|u|否定HA,干旱对其影响=1.96,P>0.05,接受σ12和σ22未知,两样本n1和n2容量较小,但可假定σ12=σ22=σ2时。用t测验。两个样本方差 平均值SSSS
(x
x
(x
x)2es2e
2
n1
该公式可变形s2(n1)s2 es2e
两样本差数的标准 s2 s2 s2 s2x12于是在假设H0:μ1=μ2时可进行t测tx1x2xS1x2x自由度为
(n1-1)+(n2-例题:用转和非转两种稻米饲养一月龄解:本题σ2和σ2未知,且为小样本,用 检验;事先不知两种饲料饲养的大白鼠增重量孰高孰低,故 尾检验。(1)假设H0:μ1=μ2,对HA:μ1≠μ2(2)规定显著水平α0.05(3)检验计算查附表4df=12+7-2=17(4推断:接受,两种稻米饲养大白鼠的增重量没有显著差别。1两样本1的检
2和
2未知,且
2≠σ21时 2此时从t分布,只能进行近似的t检验。由于σ2≠σ2,所以两样本平均数差数的 21时 2差S2和S2分别估计总体方差σ2和σ2, ss2 s2x12s x12作t′检验时,需先计算k和kk kktt′近似服从于t分布,其自由度为ν′,查t值表得tα(ν′)临界值。例.测定冬小麦3号的蛋白质含量(%)10 ,S22=0.135t检验。使尾检验。(1)假设H0:μ1=μ2对HA:μ1≠μ2(2)取显著水平α0.01(3)检验计算 kk(二)成对数据平均数比较的假设检成对数据的比较要求两样本间配成对,每一对除随机地给予不同处理外,其他试验条件应尽量一致。成对数据特点:由于同一配对内两个供试单位的试验条件非常接近,而不同配对间的条件差异又可以通过各个配对差数予以消除,因而,可以控制试验误差,具有较高精确度。配对资料的一般形观察值样本容平均1……__2__…nd注:dixi1样本(差数)的平均dind 配对n样本(差数)的标准(d(dd2in1样本(差数)平均数的标准d)2因此(用t测验的机会较多t
dsd在假设μd=0时
tdsdn-例题:现从8窝仔猪中每窝选出相同、体重接近的仔猪两头进行饲料对比试验,将每窝两头仔猪随机分配到两个饲料组中,时间3天,试验结果见下表。问两种饲料喂饲仔猪增重有无显著差异?窝12345678甲饲料乙饲料d=x1-解:1、提出无效假设与备择假H0:d
H 2、显著性水平α=0.05和3、计t值d
nSd Sdn
t Sd
88
查t值表
df
1
81t0.01(7)=因为t>3.499,P否定H0,接受HA4、推断:甲种饲料极显著优于乙种饲料成对数据平均数d体,差数平均数具有N );而每d成组数据平均数本频率的假设属于间断性计数资料。类似这些性状组成的总体通常服从二项分布,因此叫二项总体,即由“非此即彼”组成的总体。以一个样本频率的假设检验为检验一个样本频率与某一理论频率p0的差根据和的大小,其检验方法是不一样的。当或<5,则由二项式(+q展开式直接检验。p(x)
Cxp
xq当np或nq>5时,二项分布趋近正态,可u检验,但需进行连续性矫如或均大于时,则可不进行连续性矫正。样本百分数的标准误p0(1p0(1p0) uˆp0S准离差(nq>5,用tc测验ˆ
nscs[例5.8紫花和白花的大豆杂交,在F2代共得2891、假设大豆花色遗传符合一对等位的分离规律,紫花植株的百分数是75%,即H0:p=0.75;对HA:2、显著水平0.05,作两尾测验 3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 杭州师范大学《影音制作》2023-2024学年第一学期期末试卷
- 2025年挖掘机行业前瞻:2月销量同比增52.8%基建回暖推动市场增长
- 主要分部分项施工方案
- 预制盖板涵施工方案
- 灌缝胶施工方案
- 光学测试试题及答案高一
- 6年级写作第3单元冬日暖阳怎么写
- 6n.m的螺丝锁付扭矩
- cof内加少量聚合物成质子交换膜
- 低代码热区功能
- LY/T 1956-2011县级林地保护利用规划编制技术规程
- GB/T 5182-1996叉车货叉技术要求和试验
- GB/T 40289-2021光伏发电站功率控制系统技术要求
- 供货方案模版(15篇)
- 研究生二级学科证明
- 设计变更单表格
- 湖南美术出版社五年级下册书法练习指导
- 《高分子物理》配套教学课件
- 《工程化学》课程教学大纲
- 良性前列腺增生诊疗指南
- 中学生食品安全教育 主题班会课件(18张PPT) 上学期
评论
0/150
提交评论