




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、作业中的一些错误 情况1:解题过程不完整,没有明确指出 所检验的假设 和检验统计量2:算错检验统计量的值,或算错检验的 p 值。(P27Ex2)解法一:总体总共分 3 类,要检验顾客是否对这三种肉食的喜好程度相同,这 是一个分布的拟合优度检验问题。(1)要检验的原假设为H0 :顾客对这三种肉食的喜好程度相同,即要检验 H0 :顾客对这三种肉食的喜好程度的分布为猪肉13牛肉13羊肉132)3)4)2 3 (ni npi0 )2 2取检验统计量 i i0 ,检验分布为 2(3 1) ;i 1npi0;题中 n 200 , npi 0 200,i 1,2,3,则检验统计量的值为( 计算过程略 ) 3
2、200 2200 2200 22(853 )2(413 )2(743 )2233315.73200 20033p值 P( 2(2) 15.73) 0.000384 0.05 ,200 232003计算 P 值为 :npi0故在水平 0.05下拒绝 H0,即调查数据 不符合该均匀分布 .解法二(采用似然比检验 +p值形式 )(1)要检验的原假设为H0 :顾客对这三种肉食的喜好程度相同,猪肉 牛肉 羊肉即要检验 H0 :顾客对这三种肉食的喜好程度的分布为1 1 1 ,333(2)选取似然比检验统计量 rrG22ln 2 ni ln pni02 ni ln npi0 ,检验分布为 2(r 1);i
3、1nii 1nin(3)题中 n 200 , npi 0 200,i 1,2,3,则检验统计量的值为( 计算过程略 )i 0 32G22 ni lni1npi0ni16.88(4)计算 P值为: p值 P( 2(2) 16.88) 0.00022 0.05 , 故在水平0.05下拒绝 H 0, 即顾客对这三种肉食的喜好程度的分布 不是均匀分布 .注:若显著性水平取 0.05,则临界值为 1 0.05 (3 1) 0.95 (2) 5.99(P27Ex3)即要检验 H0 :学生选择这十门课的人数分布为2)3)课程1110课程 2课程101110 102 10 (ni npi0 )2取检验统计量i
4、 1npi0800 80,i 1, ,10 ,则检验统计量的值为( 计算过程 102检验分布为 2 (10 1) ;题中 n 800, npi0解法一:总体总共分 10 类,这是一个分布的拟合优度检验问题 ( 1)要检验的原假设为 :学生对这十门课的选择没有倾向性,略)22 (74 80)2 802(91 80)25.12580(4) 故在水平计算 P值为: p值 P( 2(9) 5.125) 0.823 0.05 ,0.05下不能拒绝 H0 , 即认为学生对这十门课的选择没有倾向性解法二 (采用似然比检验 + p 值形式 )1) 要检验的原假设为:学生对这十门课的选择没有倾向性,课程1 课程
5、 2即要检验 H0 :学生选择这十门课的人数分布为10110课程101102) 选取似然比检验统计量10G22ln 2i1ni lnpi0 ni102nii1ln npi0ni检验分布为2(10 1) ;3)题中 n 800 ,npi0 800 80,i 1, ,10 , 则检验统计量的值为( 计算过程10略)10G22 nii1计算 P 值为 :ln npi05.017nip值 P( 2(9) 5.017) 0.833 0.05 ,(4)故在水平 0.05下不能拒绝 H0, 即认为学生对这十门课的选择没有倾向性注:若采用拒绝域法,临界值为 12 0.05 (10 1)02.95 ( 9) 1
6、6.92 。(P27Ex4)解法一:(采用卡方拟合优度检验法 +拒绝域形式 )总体总共分 3 类,这是一个不含未知参数的分布检验问题。 (1)要检验的原假设为盈 持平 亏H0:股票投资的盈亏分布为 0.1 0.2 0.72)3)4)统计得到的频数分别为 1697,1780,2129。23 (ninp?i )2222 i? i ,拒绝域为 212(3 1) ,i 1np?i对显著性水平0.05 ,临界值为题中 n 5606, 则检验统计量的值为取检验统计量0.95 (2) 5.99 ,2 2 22 (1697 560.6)2 (1780 1121.2)2 (2129 3924.2)2 3511.
7、96 5.99560.6 1121.2 3924.2故在水平0.05下拒绝 H0,即调查数据 不符合该偏好分布 .总体总共分 3 类,这是一个不含未知参数的分布检验问题。 (1)要检验的原假设仍为H 0 :股票投资的盈亏分布为盈 持平 亏0.1 0.2 0.7统计得到的频数分别为 151+122,240, 517+240。2 3 (ni np?i )22 22)取检验统计量i np? i ,拒绝域为 212 (3 1) ,i 1np?i13)对显著性水平0.05,临界值为 02.95 ( 2) 5.991 ,4)题中 n 5606, 则检验统计量的值为2 2 22 (273 127) (240
8、 254)2 (757 889)2 188.2 5.991 127 254 889故在水平0.05下拒绝 H0,即调查数据 不符合该偏好分布.解法二:(采用似然比检验法 +拒绝域形式 ) 总体总共分 3 类,这是一个不含未知参数的分布检验问题。 (1)要检验的原假设为H 0 :股票投资的盈亏分布为 0盈.1 持0.平2 0亏.7 0 0.1 0.2 0.7统计得到的频数分别为 1697,1780,2129。32i 1ni ln nnpii0 ,2 检验分布为 2(3 1) ,拒绝域为 G 3)对显著性水平0.05 ,临界值为 4)题中 n 5606, 则检验统计量的值为 2 127 254 8
9、89 G2 (2 273ln240ln 757ln ) 147.3 5.991 273 240 757 p2)选取似然比检验统计量 G22ln 2 ni ln ni0i 1nin220.05,临界值为 02.95 ( 2) 5.991 ,检验分布为 2(3 1) ,拒绝域为 G212 (2)3) 对显著性水平4) 题中 n 5606, 则检验统计量的值为2 560.6 1121.2 3924.2G2 (2 1697 ln1780 ln2129 ln) 2800.9 5.9911697 1780 2129故在水平0.05下拒绝 H0,即调查数据 不符合该偏好分布.总体总共分 3 类,这是一个不含
10、未知参数的分布检验问题。 (1)要检验的原假设仍为H 0 :股票投资的盈亏分布为盈 持平0.1 0.2亏0.7统计得到的频数分别为273,240,757。2)选取似然比检验统计量G22ln 2 ni lni1pi02ni lnnii 1nnpi0, ni12 (2)02.95 ( 2) 5.991 ,故在水平0.05下拒绝 H0,即调查数据 不符合该偏好分布.注 1:有同学混淆了两种解法 (卡方拟合优度检验法 与似然比检验法 ) 的记号 与称呼。注 2 :本题中两种方法得到的检验统计量的值相差很大。(P28Ex5) 解法一:(卡方拟合优度检验) 总体总共分 3类,分布中有 1 个未知参数,这是
11、一个含参数的分布检验问题。 (1)要检验的原假设为红 白 粉红H0 :红、白、粉红色花的分布为 2 2 ,其中 p q 1。0p2 q2 2pq(2)先在 H0 为真时,似然函数为2n1 2n2 n3n3 2n1 n3 2n2 n360 108 132L(p) p2n1q2n2(2pq)n32n3 p2n1 n3(1p)2n2 n3260 p108 (1p)132 ,0p 1取对数得ln L(p) 60ln2 108ln( p) 132ln(1 p)求关于 p 的导数,并令之为 0 得对数似然方程为:108 1320 108(1 p) 132p 0 p 1 p解得 p 的极大似然估计值为 p?
12、 108 9240 20(3)算出 H 0的分布列中 p1, p2, p3 的极大似然估计值p?1 p?281400p?2 (1 p?)2 (1201)2121400p?3 2p?(1 p?) 29 1120 20992002 3 (ni np?i )24)取检验统计量,拒绝域为 212 (3 1 1) ,i 1np?i5)对显著性水平0.05,临界值为 02.95 (1) 3.84146 ,81121996)题中 n 120,np?1 12024.3,np?2 12036.3, np?3 120 59.4,400400200则检验统计量的值为0.01224 3.84(24 24.3)2 (3
13、6 36.3)2 (60 59.4)2 24.3 36.3 59.4故在水平0.05下不能拒绝 H 0 ,即调查数据 符合该偏好分布 .2注:有同学误认为检验的临界值为02.95 (2) 5.991解法二:(采用似然比检验 )(1) (2) (3)步骤同上。(4)算出无假定条件下诸 pi 的极大似然估计:p1 n1 24 0.2 ,1 n 120n1p2n2 362 0.3, p3 n3 60 0.5,n 120 3 n 120(5) 选取似然比检验统计量3p?ip拒绝域为 G2 12 (3 1 1) 12 (1) ,2G2 2ln 2 ni lni12(6)对显著性水平0.05,临界值为 0
14、2.95 (1) 3.84146 ,(7)则检验统计量的值为8112199G22ln2 ni lnp?i2(24ln 40036ln 40060ln 200)0.01225i 1 ipi0.20.30.5故在水平0.05下不能拒绝 H 0 ,即调查数据 符合该偏好分布 .注:p 值P( 2(1) 0.01225) 0.91 0.05(P28Ex6) 解法一:(卡方拟合优度检验) 总体总共分 4类,分布中有 2 个参数,这是一个含参数的分布拟合检验问题 (1)要检验的原假设为H0 :人的血型分布为“O”型 “A”型r2p2 2pr“B”型q2 2qrAB”型 ,其中 p q r 12pq2)先在
15、 H0 为真时,算出似然函数L(p,q,r) r2n1(p2 2pr)n2(q2 2qr)n3 (pq)n4748 2 436 2 132 58r 748(p2 2pr)436(q2 2qr )132 ( pq)58在约束条件 p q r 1下,取 q 1 p r ,化似然函数为无约束二元函数:748 2 436 2 2 132 58L(p,r) r748(p2 2 pr ) 436 (1 p)2 r 2 )132 ( p(1 p r)58取对数得ln L(p,r) 748 ln r 436 ln( p2 2pr) 132ln(1 p)2 r2) 58ln( p(1 p r) 注意到用微分法很
16、难求出极大似然估计值的精确解 ,我们考虑近似计算。首先由“ O”型和“ B”型两类的矩估计算出参数向量 ( p,r )的初始估计:r?2 0.374(1 p?)2 r?2 0.132r? 0.374 0.61161 p? 0.506 0.7113r? 0.6116 p? 0.2887然后参照课本 25页利用 EXCEL 算得 ( p, r )的极大似然估计值p? 0.288632r? 0.611379( 3)算出诸 p1, pr 的极大似然估计值p?1 r?2 0.6113792 0.373784 ;p?2 p?2 2p?r? 0.2886322 2 0.288632 0.611379 0.4
17、36236p?3 (1 p?) 2 r?2 (1 0.288632 ) 2 0.611379 2 0.13226p?4 2p?(1 p? r?) 2 0.288632 (1 0.288632 0.611379) 0.05772 且在 H 0为真时,对数似然函数的最大值为 ln L(p?,r?) -1162.1971 。2 4 (ni np?i )22 24)5)6)取检验统计量 ,拒绝域为 2 12 (4 1 2) ,i 1np?i对显著性水平 0.05,临界值为 02.95 (1) 3.84146 , 题中 n 1000, np?1 1000 0.373784 373.784, ,np?4
18、1000 0.05772 57.72 , 则检验统计量的值为( 计算过程略 )2 (374 373.78)2(58 57.72)2 0.002121 3.84373.78 57.72 故在水平 0.05下不能拒绝 H 0 ,即调查数据 符合该偏好分布 .解法二:(采用似然比检验 )(1) (2) (3)步骤同上。(4)算出无假定条件下诸 pi 的极大似然估计:nnp11 0.374 , p22 0.436 ,nnp3 n3 0.132 , p4 n4 0.058 nnp?i4np?iln i 2 ni ln i ,nii 1nin(5)选取似然比检验统计量4 p? 4G 2ln 2 ni ln
19、 i2 nii 1pii 102.95 (1) 3.84146 ,拒绝域为 G212 (4 1 2) 12 (1) ,(6) 对显著性水平0.05 ,临界值为(7) 题中 n 1000, np?1 1000 0.373784 373.784, ,np?4 1000 0.05772 57.72 , 则检验统计量的值为( 计算过程略 )2 4np?i373.784 57.72G2 2 ni ln i(2 374 ln 58 ln ) 0.002119i 1 i ni374 58故在水平0.05下不能拒绝 H 0 ,即调查数据 符合该偏好分布 .注 1 :本题中极大似然估计值的精确解很难得到 ,采用
20、迭代法进行近似计算,计算量大,要使用软件进行计算, 而且要确定未知参数向量 (p,q,r) 的迭代初始值。由于实际未知参数只有两个,需要建立两个方程用于给出迭代初始值。一个很 自然的考虑是利用诸 pi 的矩估计(也就是无假定条件下诸 pi 的极大似然估计) 可建立四个方程:2 n1 r n2n2p 2pr n2n3q 2qr n 2pq n4 n2r 2 0.374。q2 2qr 0.132为方便,关键是选择哪两个变量,和选择哪两个方程来建立方程组,计算用于 迭代的初始值。本题中,我们选择了变量 ( p,r ) ,选择了方程 注 2 : 无假定条件下似然函数374 436 132 58Lp1
21、p2p 3 p 4对数似然函数的最大值为ln L 374ln p?1 436ln p?2 132ln p?3 58ln p?4 -1162.1960 442G2 (2 lnL ln L ( p?, r?) 0.00211929 1 注: p 值 P( 2(1) 0.00212 ) 0.963 0.05(P68Ex1)解:(本题是单边检验,采用 四格表的 U 检验法 ) (1)建立四格表正常数病例数合计人数处理组20068857200745对照组201087142201229合计401775199401974(2)记概率 p1 P(正常|处理组), p2 P(正常|对照组),疫苗有效是指 p1
22、p2 ,所以本题是要检验假设H0:p1 p2H1:p1 p2 ,(3)取检验统计量 U n(n11n22 n12n21) ,拒绝域为 U u1 ,n1 n2 n 1n 21( 4)对显著性水平0.05 ,临界值 u1u0.95 (0.95) 1.645 ,(5)由题中数据算得检验统计量的值为n (n11n 22 n12n21) 401974 ( 200688 142 57 201087)U 6.01 1.645n1 n2 n 1n 2200745 201229 401775 199故在水平0.05下拒绝 H0,即疫苗有效 .注 1 :假设检验的第一步是建立假设 ,要正确建立原假设,并且要正确建
23、立备择 假设!对于备择假设,具体场合下 要能正确区分 “双边检验 ”与“单边检验(P68Ex3)解法一:(本题是单边检验,采用 四格表的 U 检验法)1)建立四格表长势良好A种肥料53B种肥料783合计836长势不好合计4710011790016410002)记概率 p1 P(长势良好 |施 A 种肥料), p2 P(长势良好 |施 B 种肥料),B 种肥料效果显著的好是指 p2 p1 ,所以本题是要检验假设H0:p1 p2H1:p1 p2 ,n1 n2 n 1n 23)取检验统计量 Un(n11n22 n12n21) ,拒绝域为 Uu1 ,4)对显著性水平0.05 ,临界值 u1u0.951
24、.645 ,5)由题中数据算得检验统计量的值为n1 n2 n 1n 2100 900 836 164U n(n11n22 n12n21) 1000(53 117 47 783) 8.71 1.645故在水平0.05下拒绝 H0,即 B种肥料效果显著的好解法二:(本题是单边检验,采用 修正的四格表的 U 检验法 )(1)建立四格表长势良好长势不好合计A种肥料5347100B种肥料783117900合计8361641000(2)记概率 p1 P(长势良好 |施 A 种肥料), p2 P(长势良好 |施 B 种肥料), B 种肥料效果显著的好是指 p2 p1 ,所以本题是要检验假设H0:p1 p2H
25、1:p1 p2 ,n(n11n22 n12n21 n)3)取检验统计量 U2 ,拒绝域为 Uu1 ,n1 n2 n 1n 24)对显著性水平0.05 ,临界值 u1u0.951.645 ,5)由题中数据算得检验统计量的值为1000(53 117 47 783 500)U 8.57 1.645100 900 836 1648.57 和 8.71似乎差故在水平0.05下拒绝 H0,即 B种肥料效果显著的好 .注 1 :本题中的样本量比较大,故是否使用连续性修正, 异不大。一般样本容量比较大时不必使用连续性修正。注 2 :本题应采用单边检验,所以 不能使用卡方检验 !(P68Ex4)解法一:(本题是
26、双边检验,采用 四格表的 U 检验法 )1)建立四格表有自杀情绪无自杀情绪合计精神病患者32225神经病患者91625合计123850( 2)记 p1 精神病患者有自杀情绪的比例, p2 神经病患者有自杀情绪的比例, 本题要检验两比例是否相等,即要检验假设H0:p1 p2H1:p1 p2 ,(3)取检验统计量 Un(n11n22 n12n21) ,拒绝域为 |U | u1 /2,n1 n2 n 1n 2(4)对显著性水平0.05,临界值 u1 /2 u0.9751 (0 .975 ) 1.96 ,(5)由题中数据算得检验统计量的值为U 1.986798525 25 12 38因为|U | 1.
27、9867985 1.96 ,故在水平0.05下拒绝 H 0 ,即两比例不相等 .解法二:(本题是双边检验,采用 四格表的卡方检验法 )(1)建立四格表有自杀情绪无自杀情绪合计精神病患者32225神经病患者91625合计123850( 2)记 p1 精神病患者有自杀情绪的比例, p2 神经病患者有自杀情绪的比例, 本题要检验两比例是否相等,即要检验假设H0:p1 p2H1:p1 p2 ,( 3)取检验统计量 2 n(n11n22 n12n21) ,拒绝域为 2 12 (1) , n1 n2 n 1n 2(4)对显著性水平0.05 ,临界值 12 (1)02.975 (1) 3.84 ,(5)由题
28、中数据算得检验统计量的值为222 n(n11n22 n12n21)2 50(3 16 22 9)22 11 22 12 21 3.947368421 3.84 n1 n2 n 1n 225 25 12 38故在水平0.05下拒绝 H 0 ,即两比例不相等 .3)4)5)H1:p1 p2 ,22 取检验统计量 G22ln 2nij ln(ni n j ) ,拒绝域为 G212 (1) ,i 1 j 1nnij12 (1)H0:p1 p2对显著性水平0.05 ,临界值由题中数据算得检验统计量的值为222 2 2ni n jG2 2nij ln( i j ) 4.091 3.84i 1 j 1nni
29、j故在水平0.05下拒绝 H 0 ,即两比例不相等 .02.975 (1) 3.84 ,解法三:(本题是双边检验,采用 四格表的似然比检验法 )(1)建立四格表有自杀情绪无自杀情绪合计精神病患者32225神经病患者91625合计123850( 2)记 p1 精神病患者有自杀情绪的比例, p2 神经病患者有自杀情绪的比例, 本题要检验两比例是否相等,即要检验假设注 1:拒绝域要与假设配套,主要看备择假设!本题是双边检验, U 检验的 拒绝 域也应是 双边形式的 ,不能再象 P68ex1那样用 单边形式的拒绝域 !具体场合下 要能正确区分 “双边检验”与“单边检验 ”。注 2:考虑到本题中的样本量
30、比较小, 特别有的格子里的值为 3(都小于 5 了!), 故使用连续性修正似乎更好些。采用四格表的 修正的卡方检验法 (解法四),则n(|n11n22 n12n21 | )3)取检验统计量 2 2 ,拒绝域为 212 (1) ,n1 n2 n 1n 24)对显著性水平0.05 ,临界值 1 (1) 0.975 (1) 3.84 ,5)由题中数据算得检验统计量的值为22.74122807 3.842 50(|3 16 22 9| 25)225 25 12 38故在水平 0.05下不能拒绝 H 0 ,即两比例相等 .有意思的是,这时候 得出了相 反的结论 !注 3: SPSS 软件能很方便地计算四
31、格表独立性双边检验的几种检验统计量和p值,下列为本题的 SPSS卡方检验的程序输出。卡方检验值df渐进 Sig. (双侧 )精确 Sig.( 双侧 )精确 Sig.( 单侧 )Pearson 卡方3.947 a1.047连续校正 b2.7411.098似然比4.0911.043Fisher 的精确检验.095.048有效案例中的 N50a. 0 单元格 (.0%) 的期望计数少于 5 。最小期望计数为 6.00b. 仅对 2x2 表计算(P71Ex12)本题是一个著名的心理学实验。 解:(本题不妨取单边检验,采用 四格表的 U 检验法)分两方面进行分析: 种口味是否比 6 种口味更能吸引顾客
32、试吃 ?种口味是否比 6 种口味更能吸 引顾客 购买?另外,数据计算上注意到:242 60% 145, 242 60% 3% 4,260 40% 104, 260 40% 30% 31。(一)种口味是否比 6 种口味更能吸引顾客 试吃? (1)建立四格表顾客试吃顾客未试吃合计种口味145972426 种口味104156260合计249253502(2)记概率 p1 P(顾客试吃 |种口味), p2 P(顾客试吃 |6 种口味), 现在要检验假设H0:p1 p2H1:p1 p2 ,(3)取检验统计量 U n(n11n22 n12n21) ,拒绝域为 U u1 , n1 n2 n 1n 2(4)对
33、显著性水平0.05,临界值 u1u0.95 1.645 ,(5)由题中数据算得检验统计量的值为n(n11n22 n12n21 ) 502(145 156 97 104) U 4.46 1.645n1 n2 n 1n 2242 260 249 253故在水平0.05下拒绝 H0, 即种口味比 6种口味更能吸引顾客试吃 .(二)种口味是否比 6 种口味更能吸引顾客购买? (1)建立四格表顾客购买顾客未购买合计种口味42382426 种口味31229260合计35467502(2)记概率 p1 P(顾客购买 |种口味), p2 P(顾客购买 |6 种口味), 现在要检验假设H0:p1 p2H1:p1
34、 p2 ,(3)取检验统计量 Un(n11n22 n12n21) ,拒绝域为 U u1 ,n1 n2 n 1n 2(4)对显著性水平0.05,临界值 u1u0.95 1.645 ,(5)由题中数据算得检验统计量的值为Un(n11n22 n12n21)502(4 229 238 31) 4.515 1.645n1 n2 n 1n 2242 260 35 467故在水平0.05下接受 H0, 即种口味没能比 6种口味更能吸引顾客购买(三)进一步考察种口味是否比 6 种口味更能吸引顾客购买? 考虑改成要检验假设H0:p1 p2H1:p1 p2 ,3)4)5)取检验统计量 U n(n11n22 n12
35、n21) ,拒绝域为 U u1 ,n1 n2 n 1n 2对显著性水平 0.05 ,临界值 u1u0.951.645 ,由题中数据算得检验统计量的值为U n(n11n22 n12n21) 502(4 229 238 31) 4.515 1.645n1 n2 n 1n 2242 260 35 467故在水平0.05下拒绝 H0, 即种口味吸引顾客购买的比例 竟然显著低于 6种口味吸引顾客购买的比例 . 这似乎有点奇怪,不过仔细想来,符合生活中的实 际情况。注 1:关于本题的背景:果酱实验选择不是越多越好? 有选择比没选择好,选择多比选择少好,这几乎成了人们生活中的常识。但实 际情况并非如此。纽约
36、哥伦比亚大学的研究人员希娜延加开展自己的实验, 研究发现,如果让 消费者选择在 6 种还是 24 种果酱中挑选一种时,人们都愿意有更多的选择。可 是真正决定购买的时候,在 6 种果酱中选择的人们作出的购买决定,是在 24种 果酱中选择的人作出购买决定的 10 倍。实验是在加州斯坦福大学附近的一个以 食品种类繁多而闻名的超市中进行的。工作人员在超市里设置了两个试吃摊位, 一个有种口味的果酱,另一个有种口味的果酱。结果显示有种口味 的摊位吸引的顾客较多: 242位经过的客人中, 60会停下来试吃,而 260 个经 过种口味的摊位的客人中,停下来试吃的只有 40。不过最终的结果却出乎 人们的意料:在
37、有种口味的摊位前停下的顾客中有30的人都至少买了一瓶果酱,而在有种口味的摊位前停下试吃者中只有 3的人购买了果酱。 看来 过多选项也不见得是一件好事,它会使人们陷入游移不定的状态。注 2 :考察种口味是否比 6 种口味更能吸引顾客购买时, 有同学采用的假设 检验如下: 记概率 p1 P(顾客购买 |试吃种口味), p2 P(顾客购买 |试吃 6 种口味), 现在要检验假设H 0: p1 p2H1:p1 p2(P69Ex5)分析:记 p1 左半球中有良性肿瘤的比例,p2 右半球中有良性肿瘤的比例, 本题要检验假设H 0: p1 p2H1:p1 p2注意到四个格子中有三个格子的频数小于 5,显然这
38、是一个 小样本 的 场合,所以题目要求采用 Fisher 精确检验法进行检验。 解:(Fisher 精确检验法 )( 1)记 p1 左半球中有良性肿瘤的比例, p2 右半球中有良性肿瘤的比例, 本题要检验假设H 0:p1 p2H1: p1 p2(2) 采用 Fisher 精确检验法,即取超几何分布 HG (16,12,10) 为检验分布,检 验的 p值为 P ( HG (16,12,10) n11), (3)题中 n11 9 ,并注意到题中 minn1 ,n 1 min12,10 10 , 故检验的 p 值为P( HG (16,12,10) 9) P(HG(16,12,10) 9) P(HG(
39、16,12,10) 10)0.109890 0.008242 0.11813212!4!1!3! 12!4!1!3!16!9!3!1!1! 16!10!2!0!4!因为0.118132 0.05 ,故在水平0.05下不能拒绝 H 0 ,即认为两比例相等 .注 1:有同学未按照题目要求解题,题目要求采用 Fisher 精确检验法 ,但仍有 同学采用单边的 U检验法甚至采用双边的卡方检验。注 2:在计算出 p 值后,有不少同学给出的检验结论是错误的。 P 值是要和检验 水平 比较的: 当 P值小时,不能拒绝原假设, 即认为两比例相等 .注 3:计算 P(HG(N,M,n)=k) ,可调用 Exce
40、l 中的函数HYPGEOMDIST (sample_s,number_sample,population_s,number_population) =HYPGEOMDIST(k;n,M,N)注 4 :下表中有其他几种方法的检验结果,由于是小样本,可以看到,连续性校 正的效果与精确检验一致。又问为何下表中精确检验的双侧p 值与单侧 p 值差不多?卡方检验值df渐进 Sig. (双侧 )精确 Sig.( 双侧 )精确 Sig.( 单侧 )Pearson 卡方3.200 a1.074连续校正 b1.4221.233似然比3.1751.075Fisher 的精确检验.118.118有效案例中的 N16
41、a. 3 单元格 (75.0%) 的期望计数少于 5 。最小期望计数为 1.50b. 仅对 2x2 表计算(P69Ex7)解法一:(Fisher 精确检验法 )(1)将这个人随机猜测作为原假设 H0 ,将有品酒能力作为备择假设。即 记 p1 P(猜测为黄酒 |实际为黄酒 ), p1 P(猜测为黄酒 |实际为白酒 ) , 本题要检验假设H 0: p1 p2H1: p1 p22)采用 Fisher 精确检验法,即取超几何分布 HG(30,15,15) 为检验分布,检验的 p值为 P(HG(30,15,15) n11), (3)题中 n11 11 ,并注意到题中 minn1 ,n 1 min15,1
42、5 15 , 故检验的 p 值为15P(HG(30,15,15) 11) P(HG(30,15,15) k)k 1115k 110.013415!15!15!15!30!k!(15 k )! (15 k)!k!因为 0.0134 0.05 ,故在水平0.05下拒绝 H0, 即认为这个人不是随机猜测, 而是有品酒能力的 注 1 :不少同学在如何建立原假设时有问题,首先应该选择“ 没有品酒能力 ”为 原假设。注 2 :如何具体表示“没有品酒能力为原假设”,将其数学化,也存在不同的想 法,这个问题的确值得进一步探讨。联系 Ex8,大家可以讨论下如何建立假设的 问题,这应该是一个没有绝对正确答案的问题
43、,应该有一定主观性。注 3 :下表中有其他几种方法的检验结果,由于是小样本,可以看到,连续性校 正的效果与精确检验一致。卡方检验值df渐进 Sig. (双侧 )精确 Sig.( 双侧 )精确 Sig.( 单侧 )Pearson 卡方6.533 a1.011连续校正 b4.8001.028似然比6.7941.009Fisher 的精确检验.027.013有效案例中的 N30a. 0 单元格 (.0%) 的期望计数少于 5 。最小期望计数为 7.50b. 仅对 2x2 表计算(P70Ex9)解:(本题应该仿照例 3.9 进行统计分析)方法一:采用 McNemar 检验记 A 检测方法 1检验为阳性
44、 ,B 检测方法 2检验为阳性 , (1)要进行边缘齐性检验,即检验假设H 0 :p1 p 1H 1:p1p 1也就是要进行对称性检验 H0:p122)采用 McNemar 卡方检验统计量p21H1:p122 (n12 n21)12 21 ,拒绝域为 2 12 (1) 。p21,n12 n213)题中 n12 18, n21 9 , 则检验统计量的值为2 (18 9)223 3.84 0.95(1) ,18 9 0.95故在水平0.05下不能拒绝 H0, 即认为检测方法 1 检验为阳性的比例与检测方法 2 检验为阳性的比例相等 .方法二:采用似然比检验(1)要进行边缘齐性检验,即检验假设H 0
45、 :p1p 1H 1:p1p 1也就是要进行对称性检验 H0:2)采用 似然比检验统计量p12p21H1:p12G 2 2( n12 lnn12 n21 n21 lnn12 n212n12p21,n12 n21 ),拒绝域为2n21 212 (1) 。( 3)题中 n12 18, n21 9 ,2 27 G 2 2(18 ln则检验统计量的值为279 ln2 18 2 9 故在水平0.05下不能拒绝 H0, 即认为检测方法方法 2 检验为阳性的比例相等 .) 3.06 3.84 02.95(1) ,1 检验为阳性的比例与检测(P71Ex11) 分析:很多同学对本题也仿照例 3.9 进行统计分析
46、, 处于 Ex10 之后,似乎按照 Ex10 进行统计分析更为合理。 关键是对文字“竞选初期支持民主党的选民后来支持共和党的比例”的解读产 生的歧义,究竟是理解成: “选民 在竞选初期支持民主党 且后来支持共和党的比 例”,还是“ 在竞选初期支持民主党 的选民中 后来支持共和党的比例” 。即究竟 是积事件的概率 ,还是 条件概率 ? 以下我把两种分析结果都罗列出来: 理解一:理解为 积事件的概率相等 ( 1)要进行 对称性检验 ,即检验假设H 0:p12 p21H 1:但也有少数同学注意到本题:采用 McNemar 检验2)采用 McNemar 卡方检验统计量p12 p21(n12 n21)2
47、12 21 ,拒绝域为 2 12 (1) 。n12 n213)题中 n12 52, n21 38 , 则检验统计量的值为2 (52 38)252 382.718 3.8402.95(1) ,故在水平0.05下不能拒绝 H0, 即认为竞选初期支持民主党且后来支持共和 党的比例与竞选初期支持共和党且后来支持民主党的比例相等理解二:理解为 两条件概率的相等 :采用 Ex10 的检验方法 记 A 选民竞选初期支持民主 党, B 选民选举时支持民主党 1)要检验假设0:P(B |A) P(B|A)H1:P(B |A) P(B| A)(考虑交换频数 n11与n12的位置,形成新的四格表,再用 U 检验)
48、(2)采用检验统计量 Un(n12n22 n11n21),拒绝域为 u u1 。n1 n2 (n12 n21 )( n11 n22)8.8758 1.645 u0.95 ,(3) 算得检验统计量的值为 un(n12n22 n11n21)n1 n2 (n12 n21 )(n11 n22)故在水平0.05下拒绝 H0, 即认为“在竞选初期支持民主党的选民中后来支持 共和党的比例”显著“小于竞选初期支持共和党的选民中后来支持民主党的比 例”.(P71Ex13)解:由题意知: P?( A | B) n11n15010 ,P?(A|B)n12n2112 50011000则相对危险度为:1P?(A|B)
49、500 2 1P?(A|B)11000又因为 P?(A |B) 1 P?(A|B)500499500110009991000P?(A|B) 1 P?(A|B) 1所以优比为:2.0020041 499500 500 2 99910001000注 1 :有些同学在解题时,设法还原出概率四格表,甚至还原出频率四格表。但 这些表格都是错的。因为仅 根据题中的已知条件是 无法还原出四格表的 !由题 意可知条件概率 P(A|B), P(A| B ) ,但不知道 P(B)或P(B)的值,所以无法 知道积事件的概率: P(AB),P(AB),P(AB),P(AB),所以 无法还原出概 率四格表 ,更无法知道
50、频率四格表。注 2:本题未要求进行显著性检验。(P108Ex1) 解:(本题是关于分布齐性的检验,也可以看作是独立性检验,应该采用二维列 联表的卡方检验或似然比检验,具体可以写成如下四种不同的解法) (1)要检验假设H 0:供应商与零件质量独立H 1:供应商与零件质量不相互独立。(也就是要进行齐性检验H 0:各供应商的零件质量分布相同H 1:供应商的零件质量分布不全相同)方法一:卡方检验 +临界值检验法2)采用 卡方检验统计量r c (nij2i 1 j 1ni n jni n j 2 ) r c nni 1 j 1 ni n j2nijn,3)4)n 拒绝域为 2 12 (r 1)(c 1)
51、 。题中0.05,临界值为 12 (r 1)(c 1) 02.95(2 2) 02.95(4) 9.488 ,检验统计量的值为2902922 445 ( ) 445 7.712 9.488 ,395 100 23 150 故在水平0.05下不能拒绝 H0, 即认为供应商与零件质量独立, 即各供应商的零件的质量分布都相同 .方法二:似然比检验 +临界值检验法2)r c n n 采用似然比检验统计量 G2 2ln 2nij ln( i j ),i 1 j 1nnij拒绝域为 G2 12 (r 1)(c 1) 。 题中0.05,临界值为 12 (r 1)(c 1)检验统计量的值为2 395 100 23 150G2 2(90 ln 9 ln ) 7.807 9.488 ,445 90 445 9故在水平0.05下不能拒绝 H0, 即认为供应商与零件质量独立, 即各供应商的零件的质量分布都相同 .3)4)20.95(2 2)02.95(4) 9.488 ,方法三:卡方检验 +p 值检验法2)采用 卡方检验统计量rci1j1(nijni n j )2rc2ni2jni n ji
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 高端车位代理销售合作协议范本
- 汽修退出协议书范本
- 钢结构加工协议书范本
- 桥梁拆除重建与交通疏导合同
- 农产品配送中心租赁与经营合同
- 特色餐厅厨师长聘任合同及菜品创新与营销方案
- 城市核心区商铺租赁合同模板
- 餐饮店租赁权及设备购置合同范本
- 餐饮连锁品牌餐厅租赁合同样本及品牌宣传协议
- 桥梁支座灌浆饱满度技术专题
- 2025年贵州茅台酒厂集团招聘笔试参考题库含答案解析
- 2024年财政部会计法律法规答题活动题目及答案一
- 如何答题?如何使用?请看这里
- GB/T 7984-2013普通用途织物芯输送带
- GB/T 16940-1997直线运动支承直线运动球轴承外形尺寸和公差
- 校级优秀毕业论文评审表+毕业设计评审表
- 2022年德宏傣族景颇族自治州工会系统招聘考试题库及答案解析
- 管道工程量计算规则
- 雪山上的达娃读后感范文5篇
- (完整版)道路交通事故现场图绘制课件
- 西方音乐史名词解释复习
评论
0/150
提交评论