版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、二、区间估计:确定一个区间,并给出该区间包含总体参数的概率。点估计的最大缺点就是由于估计量也是统计量,它必然带有一定误差。换句话说估计值不可能正好等于真值。但估计值与真值到底差多少,点估计中没有给我们任何信息。而区间估计正好弥补了这个缺点,它不仅给出了真值的范围,而且给出了真值落入这一范围的概率。因此区间估计给出的信息显然多于点估计。正态总体与2的置信区间我们主要针对正态分布讨论与2的置信区间。这一方面是因为正态分布确实是最常见的分布,另一方面是因为中心极限定理保证了当样本足够大时,不管总体服从什么分布,我们都可以把看作近似服从正态分布。因此只有当样本含量较小时,我们才需要对总体是否服从正态分
2、布加以考虑。求与2的置信区间时,选择统计量和理论分布的方法与假设检验中完全相同,然后根据所得到的接受域对未知参量解不等式,即得到所求的置信区间。假设所选择的显著性水平为,那么该区间包含总体参数的概率即为1-,称为置信水平。例 求时的95%置信区间。解:时取= ,那么:解不等式,得:即:的95%置信区间为:例3.13 求两样本,标准差i未知但相等时1-2的1-置信区间。解:两样本,标准差未知但相等时的统计量为:显著性水平为的接受域为:把t表达式代入,解得1-2的1-置信区间为:例求正态总体2的1-置信区间解:设样本方差为S2。根据式,有: 对未知参数2解不等式,得:2的1-置信区间为:上述几道题
3、我们都只进行了公式的推导,而没有代入具体的数字。当需要解决具体问题时,只须将数字代入即可。同时,我们并不希望同学们死记上述公式,而是要搞清楚在各种情况下什么是接受域,应当对哪个变量求解不等式,这样才能针对不同情况灵活使用公式。也有几种情况例题中未涉及,如2时的双样本u检验,2未知且不等的近似t检验,两方差是否相等的F检验等。相信同学们只要真正理解、掌握了上述几道例题的思想与方法,这些问题是不难解决的。另外,在某些情况下也会要求单侧置信区间,此时只要用单侧分位数代替双侧分位数即可。2. 二项分布中P的置信区间。参见国标GB4087.283二项分布的概率函数为: x = 0, 1, 2, n参数p
4、的点估计为:。n:样本含量。x:样本中具有某种属性的个体数置信区间的求法如下Pu,PL分别为区间的上下限:1n30, 且0.130, 且或时,可采用泊松近似。近似公式为: 式中,为分布的分位数,依单侧或双侧区间a可取值或。括号中为自由度。式中,同上。例 取n=50, x=5, 1-=0.95, 求双侧置信区间。解:,用接近于0的公式。 所求置信区间为。三、正态总体区间估计与显著性检验的关系:1来自于同一不等式,结果是一致的。因此必要时也可使用置信区间进行假设检验:只要看看H0中的理论值是否落在置信区间中就可以了。2直观上有一定差异。显著性检验是把H0:=0视为固定常数,依据它建立理论分布,再来
5、判断实际观察值是否小概率事件;区间估计那么是把观察值视为最可能的的取值(点估计),再以它为中心建立一个区间,并给出母体参数落入这一区间的概率(置信水平)。 非参数检验I:2检验前边我们介绍的假设检验都属于参数检验,也就是说检验目标是判断总体参数是否等于某一指定值,或两个总体的某一参数是否相等。本节主要介绍另一类检验,这就是非参数检验。它检验的目标一般与参数无关,而是总体分布的某种性质,例如是否服从某种指定的分布,两个事件是否独立等等。2检验在非参数检验中应用相当广泛。在以前的检验中我们也用过2分布,当时用于检验总体的方差2是否等于某一指定值。而本节的用法与上述用法不同,它主要基于以下的Pear
6、son定理。Pearson定理:当P1,P2,Pr是总体的真实概率分布时,统计量 随n的增加渐近于自由度为r-1的2分布。(3.30)式的统计量也被称为Pearson计量。其中P1,P2, Pr为r种不同属性出现的概率,n为样本含量,ni为样本中第i种属性出现的次数。由于ni是样本中第i种属性出现的次数,是观察值;而pi是第i种属性出现的概率,因此npi可被看作是理论上该样本中第i种属性应出现的次数。这样我们就可以换一种写法,把ni视为观察值Oi,npi视为理论值Ti,那么式可写成: 这样一来,Pearson定理实际是说如果样本确实抽自由P1,P2,Pr代表的总体,Oi和Ti之间的差异就只是随
7、机误差,那么Pearson统计量可视为服从2分布;反之假设样本不是抽自由P1,P2,Pr代表的总体,Oi和Ti之间的差异就不只是随机误差,从而使计算出的统计量有偏大的趋势。因此对上述Pearson统计量进行上单尾检验可用于判断离散型数据的观察值与理论值是否吻合。此时统计假设为:H0:Oi = T i;HA:Oi T I,但检验是上单尾检验。显然,上述数据应满足: 。另外,为了使Pearson统计量近似服从2(r1)分布,还要求:1各理论值均大于5。即:Ti 5, i = 1, 2,r。如果有一个或多个Ti 5,会使Pearson统计量明显偏离2分布,可能导致错误检验结果。2假设自由度为1,那么
8、应作连续性矫正,即把统计量改为: 还应注意由于Pearson统计量的H0为Oi = Ti,所以统计量值为0意味着H0严格成立,即它不会有下侧拒绝域,永远只用上单侧检验。Pearson统计量的应用主要有以下两个方面:吻合度检验。用于检验总体是否服从某个指定分布。方法为:设给定分布函数为F(x)。首先把x的值域分为r个不相重合的区间,并统计样本含量为n的一次抽样中,观察值落入各区间的次数,把落入区间i的次数记为Oi,i=1, 2, r;再算出在指定的分布下,x落入每一区间的概率pi ,i=1, 2, r。由于样本含量为n,因此理论上落入每一区间的次数应为Ti = npi;从而可用Pearson统计
9、量进行检验。需要特别注意的是,在做吻合度检验时,Pearson统计量的自由度可能发生变化。一般来说,如果给定的分布函数F(x)中不含有未知参数,那么Pearson统计量的自由度就是r 1;但如果F(x)中含有一个或几个未知参数,需要用从样本中计算出的估计量代替,那么使用了几个估计量自由度一般就应在r 1的根底上再减去几。如例9,观测值共分了9组,自由度本应为9 1 = 8,但由于理论分布的和2未知,使用估计量代替,因此自由度应为8 2 = 6。例 调查了某地200名男孩身高,得,分组数据见下表。男孩身高是否符合正态分布?表3.2 男孩身高分布表组号区间OiPiTi(Oi - Ti)2/Ti1(
10、-, 126)82126, 130)133130, 134)174134, 138)375138, 142)556142, 146)337146, 150)188150, 154)109154, +)9表中前三列是观察数据,后三列是计算所得。计算公式为:设区间为xi-1, xi,那么,其中为N0,1的分布函数,可查表得到。T i = 200Pi自由度df = 912 = 6 (用,S2作为,2的估计量,应再减去二个自由度)。查2分布表,得: 。由于2 P1, 也可不必计算P0。此题直观上看应有差异,但检验结果为没有,主要原因是样本量太少,应该继续观察。例 某种产品废品率p为合格。抽检20个样品
11、,发现二个废品,该批产品是否合格?假设发现4个废品呢?解:H0:p合格;HA不合格,由于废品越多时HA成立越有利,尾区应从观察值向多的方向累加。发现二个废品:尾区概率为:P=P2+P3+P20=1P0P1 = = 1 = = 接受H0,该批产品可认为合格。假设发现4个废品,那么尾区概率为:P=P4+P5+P20=1P0P1P2P30.06016 接受H0,产品应认为不合格。实际上,P0=0.358,即20个样品全合格也不能认为该批产品合格。此时应增加样本量。当n=59时,59,即只有抽取59个样品且都合格时才能拒绝H0,此时才可认为该批产品合格。从这两道例题可看出,合格标准为与0.05是非常不
12、同的。这是因为显著性检验是对H0的“保护性检验,即只有当观察到的样本取值与H0有相当显著的差异时才会拒绝。拒绝时一般比拟可靠,而且可以选择犯第一类错误的概率。反之,犯第二类错误的概率那么不那么容易确定,而且当较小时,常常是很大的。不过此时真值接近于H0中的假设值0,所以犯了第二类错误也不很严重。 非参数检验II上节主要介绍了2检验和与它有关的一些检验法。本节介绍其他一些常用的非参数检验,它们共同的特点是:1不要求总体服从正态分布。2常可用于定性数据。秩和检验:用途:检验两组或多组数据平均数是否相等。与t检验的不同点:不要求正态母体,只要求样本互相独立。方法:把全部数据放在一起,从小到大排列,每
13、个数据的位置编号就称为秩。然后再把数据按处理的不同分开,分别计算各处理的秩和,并以它为统计量。1两总体秩和检验。秩和检验的H0为:各处理效应相同。显然此时各处理的秩和也应差不多。选用样本含量较小的处理的秩和为统计量。假设H0成立,那么每个秩属于各个处理的可能性均相等。根据古典概型,应有:Pn个秩的和为某值=利用这个公式,可计算出给定下的秩和T的上下限,结果已制成表备查见书后附表12。当n时,T渐近正态分布 n1,n2充分大时通常要求有一个大于10,可使用u检验: 例 两窝20日龄仔鼠体重分别为:gA:55,60,49,66,53B:61,58,70,63,55,59它们的体重是否有差异?解:把
14、体重从小到大排列:4953555558596061636670秩:1(A)2(A)3.5(A)3.5(B)5(B)6(B)7(A)8(B)9(B)10(A)11(B)由于A样本含量小,选它的秩和作统计量:TA=查表,n1=5, n2=6, =0.05, 得:T1=20,T2=40T1TA5, 总样本含量N15。H0:各总体均值无显著差异。统计量: 3 .36其中ni,Ti分别为各样本含量和秩和,k为总体数,为总样本含量。可证明,在上述条件ni 5, N15下,H近似服从自由度为k-1的2分布。例 四条河流含某种微量元素值为:PPm其含量是否有显著差异?解:混合排序,得:a: 0.52 0.54
15、 0.61 0.70 0.71 0.75 0.78 n1=7秩:3 5 11 17 18.5 22.5 24.5 T1b: 0.56 0.61 0.66 0.68 0.71 0.72 0.75 0.80 n2=8秩:7.5 11 15 16 18.5 20.5 22.5 26 T2=137c: 0.40 0.42 0.53 0.55 0.56 0.59 0.61 0.63 n3=8秩:1 2 4 6 7.5 9 11 13.5 T3=54 n4=6秩:13.5 20.5 24.5 27 28 29 T4,代入6式,得:df=41=3,查2分布表,得: H3,差异极显著,拒绝H0,即:这四条河该
16、种微量元素含量差异极显著。秩和检验的几点考前须知:a) 假设有几个观察值相同,它们的秩都应取为平均数,因此都相等。例如例3.30中的0.56有两个,它们应排在第7, 8位,因此秩都取为7.5。b)一般来说,成组数据的t检验和下面要学的用于多总体均值检验的方差分析比秩和检验更准确,这是因为秩和检验只利用了局部信息,即只利用了排序的位置,没有利用差值的大小。但秩和检验可用于更广的范围,如总体非正态,定性数据等。符号检验本检验相当于对配对数据的检验,但只考虑每对数据差值的符号,而不管其绝对值大小。H0:两处理无差异。显然假设H0成立,那么“+与“-出现概率均为1/2,令n+ ,n_分别代表“+与“-
17、出现次数,那么n+,n_均应服从的二项分布。令k=min(n+ ,n_),那么有:其中n = n+ + n_。将尾区概率P与或相比,可作出统计推断。n较小时,符号检验的分位数也有专门表格可查;n较大时,k渐近正态分布:Nnp, npq。由于,有:符号检验的优点与秩和检验类似,主要是不要求总体服从正态分布,可用定性资料,计算简单。缺点是利用信息较少,不够准确。考前须知为:a) 假设有差值为0那么舍去,样本含量n相应减1。b) n4时,由于(1/2)4 0.05,永无拒绝H0的可能。此时不能用符号检验。例3.31 用两种方法处理后污水含量如下:表3.5 两种方法处理后污水含量PPmA方法B方法差值
18、符号:A方法B方法4差值符号:处理效果是否相同?解:用符号检验: n+ =12, n_=3。查表,n=15, 双侧检验临界值为:3;为:2。此题中n_=3, 差异显著,但未达极显著水平。应拒绝H0,可以认为两种方法效果有明显差异。用配对数据t检验:差值。查表,t(14)=2.145, t(14)=2.977, ttt, 差异显著,但未达极显著水平,结论与符号检验相同。但假设把第11组数据交换一下:A:10.26, B:10.38, 那么n_=4,符号检验结果为接受H0。而t检验结果为: 差异仍为显著但未达极显著。此时显然t检验的结果更可靠。游程检验当用样本对总体进行估计时,样本必须是随机的。如
19、何检验样本的随机性呢?游程检验就是常用的方法之一。所谓游程,就是我们用某种标准把样本分为两类,一类记为a,一类记为b。把它们按出现顺序排列,连续出现的同一种观察值一串a或一串b就称为一个游程。每个游程内包含的观察值个数称为游程长度,游程个数称为游程总数。当然aaabbb和ababab都不太可能是随机样本。因此游程数太多太少都应否认随机性。以Ra记a的游程个数,na,nb分别表示序列中a,b的个数,那么可证明Ra服从超几何分布。当N= na+ nb不太大时,可查表得到临界值;注意查表时用的是总游程R= Ra+ Ra,不是Ra。假设N很大,那么可用正态分布来近似: (3.38)注意此时用的统计量为
20、Ra,期望和方差表达式中na和nb的地位不是对称的。例 判断以下序列的随机性:(1) na=12, nb=15, R=8(2) na=nb=18, R=20(3) na=25, nb=22, Ra=10, Ra=9解:1查表,得R1=8,R2=20,R=R1,拒绝H0,不能认为该序列是随机的。 2查表,n1=n2=18, 得:R1=12,R2=26,R1R R2, 接受H0,可认为该序列是随机的。3用近似检验: , 接受H0,可认为是随机序列。如果原始数据是定量数据,那么在未用游程检验之前必须进行变换,把它变成一串ab序列。常用的变换方法为把全部数据从小到大排列,把前一半换成a,后一半换成b,
21、再放回原来的位置,即可进行游程检验。如果样本容量n为奇数,那么可把中间一数舍弃。例 检验以下一组数据的随机性:2.56, 2.73, 3.05, 2.87, 2.46, 2.93, 2.41, 2.58, 2.89, 2.76, 3.12, 3.03, 2.86, 2.53, 2.79, 2.80, 2.96, 2.68, 2.89解:将全部数据从小到大排列,得:2.41, 2.46, 2.53, 2.56, 2.58, 2.68, 2.73, 2.76, 2.79, 2.80, 舍去中间一个,上排数以a表示,下排数以b表示,放回原位,得:a a b b a b a a b a b b b a
22、 a b a b 共18个数据,n1=n2=9,总游程数R=12。查表,得=时,R1=5,R2=15。R1RR2,可认为数据随机。注:游程检验也可用于其他目的,例如可检验两样本是否抽自同一总体。方法为把它们混合排序,假设抽自同一总体,序列应为随机的;假设期望不同或方差不同,游程数都有减少的趋势。因此可作统计检验。秩相关检验本方法用于检验两个指标间相关性。例如抽取容量为n的样本,每一个体测定X,Y两个指标,要检验X,Y间的相关性。方法:把X,Y指标分别从小到大排序,对每一个体可得它的两个指标的秩值,记为和。令 如果数据中有许多相同的值,那么它们的秩也应相同,都取为它们秩的平均数。这种秩相同的情况
23、对检验结果是会有影响的。如果秩相同的较多,那么应加以修正:对每次涉及m个秩相同,令: (3.40)然后分别对两个变量中的t值求和,记为和,令 (3.41)计算rs的修正公式为: 3.42rs称为秩相关系数,可用它查相关系数表进行统计检验。当样本量较大时,也可采用t检验: 对普通相关系数详见来说,样本抽自正态总体是非常重要的,否那么很可能得到完全错误的结论。如果总体非正态,又没有适当的变换方法可使它成为正态,那么应使用秩相关的检验方法。例3.34 调查得几个地区大气污染综合指数PI与肺癌发病率如下见表:表 大气污染综合指数与肺癌发病率地区1234567PI肺癌发病率PI与肺癌发病率是否相关?解:
24、把表3.6中数据换为相应的秩:地区号1234567PI秩7546312肺癌发病率秩7654321代入9式,得:查表,得r(7) = 0.786, rr(7) rs r(7),拒绝H0,差异显著,但未达极显著。可认为大气污染综合指数PI与肺癌发病率有关。总的来说,本节所介绍的各种非参数检验方法检验精度都不高,如果原始数据是连续的定量数据的话,它们都不能充分利用原始数据中的信息。而且除游程检验外,它们都有与之对应的参数检验,这些参数检验都能更充分地利用连续定量数据中的信息。即使这样,非参数检验在统计学中仍占有一定位置,主要原因就是它们对总体分布没有特别要求;而那些参数检验一般都要求样本抽自正态总体
25、。如果样本含量很大,有近百或数百之多,那么对总体为正态的要求不是一个太大的问题,因为此时中心极限定理保证了其平均数近似服从正态分布;但如果是小样本,又不是正态分布,强行使用参数检验那么很可能得出错误的结论。此时一般要求对数据进行变换,但在样本含量小,对真实总体分布又了解不多的情况下,选择正确的变换方法也是困难的。在这种情况下,非参数检验就成了较好的替代方案。因此这些非参数检验主要用于小样本,非正态总体的情况下。作业环境因素造成的小麦抽穗期的方差为2 = ,今测得某种杂交小麦子二代158株抽穗期样本方差为S2 = 5.386,问这一差异是否全由环境因素造成?14岁女孩平均体重为。现抽取10名同龄
26、的女运发动,其体重为:39, 36, 43, 43, 40, 46, 45, 45, 41, 42。问这些运发动的平均体重与同龄女孩是否相同?10株杂交水稻单株产量分别为:272, 200, 268, 247, 267, 246, 363, 216, 206, 256克。普通水稻平均单株产量为250克,标准差为2.78克,问杂交稻单株产量是否明显增加?饲养场规定,肉鸡平均体重超过了3公斤时方可屠宰,现随机抽取20只,测得, s=0.2kg,该批鸡是否到达屠宰批准?假设标准为到达3公斤即可呢?5. 某种果汁中VC含量服从正态分布,其质量标准规定VC含量不得少于20g/l, 标准差不得大于2g/l
27、,现抽取10个样品进行检验,得, S=3.69/l, 问这批产品是否合格?6. 杂交杨树育种目标为5年生树高到达10m。现抽测50株,得平均树高,样本标准差,问是否到达育种目标?7. 为检查某降压药的疗效,选20名患者作实验。服药前后的舒张压分别为(mmHg):患者号1234567891011治疗前11411715511411910214091135114103治疗后941141259812195104951069287患者号121314151617181920治疗前140136126108142114113116121治疗后138112114911409188106112该药是否有效?8.
28、用两种电极测同一土壤样品PH值,结果如下:A电极:B电极:5问它们的结果是否相同?如果是四个样品两个电极分别测定的结果呢?9. 给幼鼠喂不同饲料,研究每日钙留存量是否不同。以两种方式设计本实验。第一种方式:同一鼠先后喂不同饲料。鼠号:123456789A饲料33.1B饲料第二种方式:甲组12只喂A饲料,乙组9只喂B饲料.A饲料29.7, 26.7, 28.9, 31.1, 33.1, 26.8, 36.3, 39.5, 33.4,31.5,B饲料28.7,28.3,29.3,32.2,31.1,30.0,36.2,36.8,30.0.检验这两种方式中A和B饲料的钙存留量是否有差异,并对两种方法
29、进行比拟。10. 两群奶牛,各有50头。历史纪录日产奶量标准差分别为1=10kg, 2=8kg;某日测得平均每头产量为 问两群牛产量是否有差异?11. 前人结论说某品种玉米自交二代每穗粒重比自交一代会减少10g,现测得自交一代25穗,S1=;自交二代30穗,S2=20.1g,实测数据是否符合前人结论?12.为比照两种肥料的效果,把试验田按肥力,灌溉条件等划分为9块根本一致的小区,每个小区再分成两半,各自随机施用一种肥料。所得产量kg如下:每一小区为一列A肥料13.4813.20B肥料A肥料能否比B肥料增产1kg以上?13. 对两品种作吸浆虫抗性比照试验。甲品种检查590粒,受害132粒;乙品种
30、检查710粒,受害203粒。两品种抗性是否有差异?14.试验1000粒种子,有620粒发芽,试求发芽率95%置信区间。15.正态总体方差为2,现欲使的1-置信区间长度不大于L,问应抽取容量为多大的样本?16. 纯种玉米株高方差不应大于64cm2。现测量某一品种玉米75株,得株高=2100cm, s=10cm, 问是否可说这一品种已不纯?请给出实测株高方差的95%置信区间。17. 分别建立第7题中治疗前后血压值的95%和99%置信区间。18.某地区发现,896名14岁以下儿童中有52%为男孩,给出男孩比例的95置信区间,并估计这群儿童性比是否合理。19. 服用A药物的30个患者中有18人痊愈,服用B药的30患者中有25人痊愈,问这两种药物疗效有无差异?20. 上题中假设6人服A药痊愈5人,6人服B药痊愈3人,那么结果如何?21. 水质检验要求每毫升水中大肠杆菌不得超过3个。现取1毫升检验,发现4个细菌,问是否可据此断定水质超标?假设发现7个细菌呢?22. 两块田中调查小麦锈病发病率,第一块田有锈病372叶,无锈病24叶;第二块田有病330叶,无病48叶,请用列联表及百分数差异显著性检验两种方法比拟这两块地发病率是否一致,并对结果加以比拟
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 全新公司合同担保协议下载
- 借贷居间合同
- 食品检测服务合同
- 吊车施工合同
- 个人借款给企业的合同范文
- 污水处理厂运维合同履约承诺书
- 基于线性材料插值的超弹性结构拓扑优化方法研究
- 多参量智能光纤传感系统研究
- 列车轴装通风式制动盘流量特性的数值研究
- 开放世界中的目标感知与多任务决策方法研究
- 高考模拟作文“文化自信:春节走向世界”导写+范文3篇
- 苏教版三年级下册数学计算能手1000题带答案
- 改善护理服务行动计划总结报告
- 湖南汽车工程职业学院单招职业技能测试参考试题库(含答案)
- 第2课+古代希腊罗马(教学设计)-【中职专用】《世界历史》(高教版2023基础模块)
- 中储粮兰州公司考试笔试题库
- 焊接机器人在汽车制造中应用案例分析报告
- 重建成长型思维课件
- 电捕焦油器火灾爆炸事故分析
- 质量问题分析及措施报告
- 汽修厂安全风险分级管控清单
评论
0/150
提交评论