2概率分布与t检验._第1页
2概率分布与t检验._第2页
2概率分布与t检验._第3页
2概率分布与t检验._第4页
2概率分布与t检验._第5页
免费预览已结束,剩余21页可下载查看

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、第二章概率分布与脸验§2-1理论分布§2-2样本平均数的抽样分布§23统计假设检验概述§ 2-1理论分布、事件与概率1事件(1)必然事件:(2)不可能事件:随机事件:随机事件的特点: 在一定的条件下,有多种可能的结果发生,事前人们不 能预言哪种结果; 对一次或少数几次观察或试验而言,其结果呈现偶然性、 不确定性; 但在相同条件下进行大量重复试验时,其试验结果呈现 出某种固有的规律性一频率,即随机事件的统计规律性。F例如,种子的发芽率试验,少量的种籽作试验时,其发芽率可能是85%、95%,0但当进行重复大量样本的试验时,其发芽率越来越接近90%,V这90%

2、实际上是这批种籽的发芽率或称为概1.2概 率:在相同条件下进行n次重复试验,如果随机事 件A发生的次数为m,那么m/n称为随机事件A 的频率(frequency);心当试验重复数n逐渐增大时,随机事件A的频 率m/n越来越稳定地接近某一数值P,那么就 把为随机事件A的概率。13小概率事件原理*概率表示了随机事件在一次试验中出现的机率。、若随机事件的概率很小,例如<0. 05. 001、0. 001,称之为小概率事件。心小概率事件虽然不是不可能事件,但在一次试验 中出现的可能性很小,实际上可以看成是不可能/ 发生的。-*统计学上,把小概率事件在一次试验中看成是不可 能发生的事件称为小概率事

3、件原理。V此原理是统计学上进行假设检验(显著性检验)的 基本依据。2概率分布(连续型随机变量)1)连续型随机变量(如身高、体重、物质浓度)的概率 分布,可用随机变量X在某个区间内取值的概率 P (ax<b)来表示。却概率分布密度函数,当X取值于区间a,b的概率为 中阴影部分的面积P(a<x<b)= fx)dx图2-1概率分布曲线0s正态分布(Normal distribution)11正态分布的定义及其特征(1)正态分布的定义«若连续型随机变量X的概率分布密度函数为I1 )/U) = e "2CT y! 2717其中"为平均数,昭为方差,则称随机

4、变量X服从 正态分希,iB为xN(pe2)20(比)=jJ e 2 du4)3.2标准正态分布:将一般的N(P , O 2)转换为P =0, a 2二1的正态 5布。我们称U =0, a 2=1的正态分布为标准 正态分布。:标准正态分布的概率密度函数及分布函数分别记作V(U)和(U),如式3)及4)式得:3)s3) =j=a/ 2花十菇柱何一个服从正态分布N ( P ,。2)的随机 变量X,都可以通过标准化变换,u=(X- U ) / a5)将其变换为服从标准正态分布的随机变量U。U称为标准正态变量(standard normal deviate)。心按5)式计算,对不同的U值编成函数表,称为

5、 正态分布表,见附表1,从中可查到U在任意 -个区间内取值的概率。3.3正态分布概率的计算1)标准正态分布的概率计算(N0RMSDI ST) 心设U服从标准正态分布,贝lju在叶出内取值 的概率为:1III、1二I p« UII !«, -M" P(«i <u <Uj)= . I £ 2 du = j=0 2 du1= f e 2 du=<t>(U2)(Ui)心而(W)与(U2)可由附表1查得。关于标准正态分布,以下几种 概率应当熟记:<P(-l<f/ <1)=0.683"(J96M <

6、196) =C心P (-2.58</ <2.58) =C:对于一般正态分布2卸+<0 =0.6!0P (p-1.96oS < p+1.'=0.95gP (p-2.58tySt <p+2.58o)=0.99(3)两尾概率和一尾概率数理统计中,把随机变量精在平均数P加、减不 同倍数标准差O区间之外的概率称为两尾概率,记 作a。随机变量"W U 一kG或Nu +/ro的概率,称为一尾 概率,记作0/2。心例如,X落在(U-1.96O, U+1.96O)之外的双尾概率为 0. 05,而单尾概率为0. 025o心即P(xV U-1.96 0)= P(x&g

7、t; u+1.96 0)=0. 025两尾概率或一尾概率如图2-4所示。0 熾在(U -2. 58 O . U +2. 58 O )之外的双尾概率为0. 01, 心而单尾概率P(xV U -2. 58 O ) = P(x> u +2. 58 a ) =0. 005§ 2-2样本平均数的抽样分布1、样本平均数抽样分布1.1定义:从一总体随机地抽取样本容量为n的样本,由 这些样本算得的平均数随抽样次数的分布, 称为样本平均数的抽样分布。样本平均数与原总体平均数U相比表现出的 差异是由随机抽样造成的,称为抽样误差 (sampling error) o由总体随机抽样(random sa

8、mpling)的 方法可分为有返置抽样和不返置抽样两 种OV前者指每次抽出一个个体后,这个个体应 重返原总体;心后者指每次抽出的个体不返回原总体。:对于无限总体,返置与否都可保证各个 体被抽到的机会相等。心对于有限总体,就应该采取返置抽样, 否则各个体被抽到的机会就不相等。1.2中心极限定理:若有一随机变量服从总体平均数为U、 方差为O 2的分布,则从这个总体中随机/ 抽取容量为的样本,随样本容量打的不断增大,其样本平均 数的分布亦愈来愈趋于正态分布,诵本平均数分布的平均数和标准差分别记为和6°心且具有平均数为P、方差为o2/n的分布J 称为中心极限定理。V b丘是样本平均数抽样总体

9、的标准差,简称标准误 (standard error)。总体的两个参数与X原总体的两个参数有如下关系:&=“,乐=刃厶无论胡艮从何种分布,一般只要n>30,就可认为的 分布是正态的。在正态分布总体中,以相同n抽取若干个样本(如:试 验重复n=3)时,样本均数的分布仍服从正态分布。1.3标准误样本平均数抽样总体的标准误G的大小反映 样本平均数抽样误差的大小,即精确性的高 低。心总体标准差。往往是未知的,七难计算,但可 用样本标准差S估计:故,S壬即样本标准误或平均数标准误可估计 总体平均数的标准误。S _ 1工(宀)2-1)_ I工兀2 一(丫兀)2 Inq n(n-l)卞蒔祷准差

10、与样本标准误是两个不同的统计S。i二者的区别在于:心样本标准差S是样本中各观测值兀"兀力兀3,变异程度的一个 指标,反映了 X对该样本代表性的强弱。心样本标准误是样本平均数的标准差,它是亍抽样误差的估 计值,说明了 X精确性的高低。:对于大样本资料,常将样本标准差S与样本平均数配 合使用,记为元土S,用以说明所考察指标的优良性 与稳定性。对于小样本资料,常将样本标准误与样本平均数配g 使用,记为牙土Sn用以表示所考察指标的优良性旦 抽样误差的大小。)2、/分布(f-distribution)E用来研究小样本的抽样分布,是由William S. Cosset 于1908年以Studen

11、t的笔名发表的论文.由样本平均数迪样分布的性质知道:若XXN ( " , O 2),贝阮NI , a 2/n)。则"心将随机变量标准化得:U =(X II)/cr-:当总体标准差a未知时,以样本标准差易弋替。所 得到的统计®记为仁r = (x-/z)/S-在计算升时,由于采用S来代替。,使得亡变量不 再服从标准正态分布,而是服从 旳*布(Cosset & Fisher)。专它的概率分布密度函数如下:=十厂51)/2(1 + 11)-辰W/2) df)V式中,亡的取值范围是(-8, +8); d仁nT 为自由度。j:布的平均数和标准差为:P £=0

12、,6 = yldf/(df-2)(少2)* r分布的标准差与总体标准差没有关连。因此,特别 适用于抽样误差大的小样本。二I)形>布受自由度的制约,每一个自由度都有一条 旳布密度曲线。 2)册布密度曲线以纵轴左右对称,且在十=0时, 函数值最大。 3)与标准正态分布曲线相比,旳<布曲线顶部略低, 两尾部稍高而平。刃越小这种趋势越明显。 4) 越大,f分布越趋近于标准正态分布。9当/2>30时,/分布与标准正态分布的区别很小; x?»w>100时,r分布基本与标准正态分布相同;飞2-3统计假设检验概述K显著14检验的基本原理1.1概念«1)统计检验(统计

13、推断儿 根据抽样分布规律 和概率理论,由样本统计数去推断总体参数 的方法。包括假设检验和参数估计«2)假设检验:根据某种实际需要,对未知或 不完全知道的统计总体提出一些假设(这些假 设构成完全事件),然后由样本的实际结果计 算后作出的在一定概率意义上应当接受的那 种假设的检验。V如在白班生产的产品与晩班生产的产品, 其质量的差异是由抽样误差产生的还是由生 产工人产生的差异。 3)参数估计.由样本的统计数对总体的 参数作出的点估计和区间估计。 4)点估计:以统计数估计相应的总体参 数。如由样本平均数估计总体平均数,由样本标准误估计总体标准误。 5)区间估计.根据统计数的概率分布, 估计

14、出相应的总体参数(8 )的范围区间1.2显著性检验的意义:对两个样本进行比较时,判断样本间差异是 抽样误差造成的,还是本质不同引起的。心这正是显著性检验要解决的问题。:由于总体平均数未知,在进行显著性检验时 只能以样本平均数作为检验对象,更确切地 说,是以两样本平均数的差数作为检验对象。,为什么以样本平均数作为检验对象呢? 这是因为样本平均数具有下述特征: 1)、离均差的平方和最小。说明样本平均1 数与样本各个观测值最接近,平均数是资1 料的代表数。!心2)、样本平均数是总体平均数的无偏估计 4caIB. o根据统计学中心极限定理,样本平均 数的分布服从或逼近正态分布。1-3统计假设检验的数学

15、模型:对于两个不同处理的样本,其平均值表示为:兀1 = “1 + 6兀2 = “2 + 2迢 X兀2 (“ 勺2)+(6 2)和 分:一部分是两个总体平均数的差(),称试验的(treatment effect) 昂l部分是()o巧&22、显著性检验的基本步骤(1) 首先对试验样本所在的总体作假设I、无效假设(HA 假设总体平均数与某一指定 值相等或假设两个总体参数相等,这种假设 称为无效假设,表示处理效应无效,是由误差 造成的。HQ : fl =卩2II、备择假设(Ha):备择假设是在无效假设被 否定时准备接受的假设,与无效假设一起构 成完全事件。Ha : “工“21) 提出无效假设与

16、备择假设:“ = 50Q/a :“h5002) 计算地 经计算得:元=5027, S = 8.6416心匕= 5027-5譽 “988S 8.64167106 = n-l = 10-l=9由莎9,查婕利附表3) />0. 05,故,> (2)确定显著水平a ,般为005或0. 01的小 概率。心(3)在无效假设成立的前提下,根据统计数的 抽样分布规律,计算无效假设正确的概率。J (4)根据“小概率事件不可能性原理”否定或 接受无效假设O、若Pvz,或t >1,则在a水平上否定Ho,接受Ha; 、若PM,或Irl丸,则在"水平上接受Ho,表明是因 误差而产生的。>

17、;L'irrr某矿泉水企业的自动装罐机,在正常工作状态时, 每罐净容S具正态分布N (500, 64)(单位:mDo某日随机 抽查了 10瓶,得结果如下:505,512,497,493,50& 515, 502, 495, 490. 510,问瓶装机工作是否正常? 解:根据题意,本例应进行双尾十检验。)3)查临界地,作出统计推断 得0.05=2.262,因为I十|<七0 05, 即装罐机工作正常。、两尾检验与单尾检验(1)两尾检验:无效假设HQ :从=d:备择假设H幷:“ H “2V备择假设中包括了“2或“ “2两种可能。 心这个假设的目的在于判断两均值有无差异, 而不考

18、虑谁大谁小。«在生产实践中,双尾检验不一定符合实际情况, 常用一尾检验。V如采用某种新的技术来提高某化工产品的质量, 此种技术的实施不会降低质量。)尾检验即统计假设仅有一个否定区域的检验叫一尾 检验。此时查一尾检验的临界tfiS。心无效假设应为:Ho :“心备择假设应为:Ha:从4 即新配套技术的实 施使质量有所提高。这时的否定域在椅布曲线 的右尾。反之,若无效假设丹0 : “I “7备择假设/人:“1 " 此时的否定域在朽 布曲经的左尾。显然,单尾检验的/二双尾检验的tgHa: M >M 0Ha: M <P o尾检验*4*识;尾检验还是双尾检验,应根据专业知 识及要求在试验设计时确定。一般若事先不知道所比较的两个处理效果 谁好谁坏,分析的目的在于推断两个处理 效果有无差别,则选

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论