统计建模与R软件第五讲PPT学习教案_第1页
统计建模与R软件第五讲PPT学习教案_第2页
统计建模与R软件第五讲PPT学习教案_第3页
统计建模与R软件第五讲PPT学习教案_第4页
统计建模与R软件第五讲PPT学习教案_第5页
已阅读5页,还剩25页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、会计学1 统计建模与统计建模与R软件第五讲软件第五讲 第1页/共30页 5.1 5.1 基本概念注解基本概念注解 120 (,), n PXXXW W S 1 S 2 += 第2页/共30页 犯第一类型错误的概率可以通过显著性水平来控制。 00 H |HP否定是真实的 第二类型错误:接受了错误的原假设。(取伪) 犯第二类型错误的概率常用表示,即: 00 H |HP接受是错误的 第3页/共30页 犯错误的概率的计算是比较复杂的,以正态分布为例,H0: =0,但是 实际上H0为伪,即:!=0, =1.在H0 假设下, 我们可以在总体均值为 H0和H1两种情况下,分别作出两条正态分布曲线(A线和B线

2、),见图1。 在理论上存在的若干个样本均值中,只要某个样本 均值XiX B/2时, 我们将误认为H0为真,也就是不拒绝H0。 由于真实情况是H1为真(H0为假),这样我们就犯了错误,即纳伪的错误。 犯错误的概率大小就是相对真实情况H1(正态曲线A)而言,图1中阴影部分的面积: = ( ZX B1-/2 )- ( ZXB/2 ) (ZX B1-/2 ,ZXB/2 分别是H0假设下的分位点) X B1-/2 (H0 ) (H1)真实的情况: X B/2 第4页/共30页 00 1H |HP 否定是错误的 功效可以告诉我们,在备择假设是真时(应该否定H0)时,我们可以否定H0 的可信程度.若功效太低

3、,即使真实的与0之间有差异,也很难被所用的检验方法发现.而不充分的样本量总是造成检验的低功效. 已知方差时正态分布均值的单样本z检验的功效: 01 1 | Z) /n (- 1 0 1 1 H X PZ n x H H0 0 11 0 0+ 1- H H1 1 x 1 01 1 H PXZ n Z ) ( 1 101 1 1 H X PZ nn 1 101 1 () H X PZ nn 01100 :;:HH 单侧备择单侧备择 : 第5页/共30页 = 影响功效的因素: 变小,则z减小,所以功效也减小; 若备择均值远离无效均值(即|0- 1|增加),则功效增加; 增加,功效减小; 样本量n增加

4、,功效增加; 和1固定,样本量n多大才能达到希望的功效? 在单侧检验: 双侧备择下的样本量: 第6页/共30页 power.t.test( n = NULL, delta = NULL, sd = 1, sig.level = 0.05, power = NULL, type = c(two.sample, one.sample, paired), alternative = c(two.sided, one.sided), strict = FALSE) Arguments nNumber of observations (per group) deltaTrue difference in

5、 means sdStandard deviation sig.levelSignificance level (Type I error probability) powerPower of test (1 minus Type II error probability) typeType of t test alternative One- or two-sided test strictUse strict interpretation in two-sided case Power calculations for one and two sample t tests Usage 第7

6、页/共30页 power.t.test(n = 20, delta = 1) #已知样本量, 求功效 power.t.test(power = .90, delta = 1) #已知功效, 求样本量 Two-sample t test power calculation n = 20 delta = 1 sd = 1 sig.level = 0.05 power = 0.8689528 alternative = two.sided NOTE: n is number in *each* group Two-sample t test power calculation n = 22.0211

7、0 delta = 1 sd = 1 sig.level = 0.05 power = 0.9 alternative = two.sided NOTE: n is number in *each* group 第8页/共30页 一个正态总体的情况 双边 00 10 : : Hu Hu 单边 0010 0010 :,: (:,:) Hu Hu orHu Hu 0 (0,1) / X ZN n 0 (1) / X t n Sn 2 已知时: 2 未知时: 拒绝域: /2 |ZZ 拒绝域: /2 |(1)Ttn 0 (0,1) / X ZN n 0 (1) / X t n Sn 2 已知时: 2

8、未知时: 拒绝域:()ZZorZZ 拒绝域: (1)(1)TtnorTtn 第9页/共30页 ) if (side0) 1-P else if (P1/2) 2*P else 2*(1-P) ( ) x Pp t dt #根据参数的个数计算 #左侧检验: =P(下分位点) X #右侧检验: =1-P(上分位点) X #双侧检验: =2P X X 与与比较,如果比较,如果 , 则拒绝则拒绝H0 X H H0 0 0 x X P 第10页/共30页 t-(xb-mu)/(sd(x)/sqrt(n) P P 值,则在显著性水平下拒绝原假设. 如果 P 值,则在显著性水平下接受原假设. 第11页/共3

9、0页 0010 :225, :225HH x=c(159,280,101,212,224,379,179,264,222,362,168,250,149,260,485,170) source(mean.test1.R) mean.test1(x,mu=225,side=1) mean df T P_value 1 241.5 15 0.6685177 0.2569801 t.test(x,alternative=greater,mu=225) One Sample t-test data: x t = 0.6685, df = 15, p-value = 0.257 alternative

10、hypothesis: true mean is greater than 225 95 percent confidence interval: 198.2321 Inf sample estimates: mean of x 241.5 0010 :225, :225HH side=-1 0.05,平均寿命 不大于(小于)225 p-value=0.743020.05,平均寿命 不小于(大于)225 是否有理由认为元件的平均寿命小于225? 平均寿命小于225是小 概率事件 拒绝域比显著性水平小 问题重点: 第12页/共30页 22 12 , 已知时: 拒绝域: 012112 :,:HuH

11、u单边 II: 012112 :,:HuHu双边: 012112 :,:HuHu单边I: 22 12 未知时: 22 12 未知时: ZZ 单边 II: /2 |ZZ 双边: ZZ单边I: 22 12 12 (0,1) XY ZN nn 拒绝域: 12 (2)Ttnn 单边 II: /212 |(2)Ttnn 双边: 12 (2)Ttnn 单边I: 22 1122 12 (1)(1) 2 nSnS S nn 12 12 (2) 11 XY Tt nn S nn 拒绝域: ( )Tt 单边 II: /2 |( )Tt 双边: ( )Tt单边I: 2 2222 1212 22 121122 / (

12、1)(1) SSSS v nnnnnn 22 12 12 ( ) XY Tt SS nn 第13页/共30页 22 12 , 已知时 22 12 未知时 22 12 未知时 22 12 12 XY Z nn #P-value 12 11 XY T S nn 22 1122 12 (1)(1) 2 nSnS S nn 22 12 12 XY T SS nn 2 2222 1212 22 121122 / (1)(1) SSSS v nnnnnn #P-value 第14页/共30页 标准方法78.172.476.274.377.478.476.075.576.777.3 新方法79.181.07

13、7.379.180.079.179.177.380.282.1 设这两样本相互独立,且分别来自正态总体N(12)和N(22),其中1、 2和2未知,问新的操作能否提高得率?(=0.05) x=c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3) y=c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1) mean.test2(x,y,var.equal=TRUE, side=-1) mean df T P_value -3.2 18 -4.295743 0.0002175927 0.05,落在

14、拒绝域内,所以拒绝 原假设,接受10.05,不能拒绝H0,即接受H0:10.05,不能拒绝H0,即接受H0:1 2 mean.test2(y,x,var.equal=TRUE, side=1) mean df T P_value 1 3.2 18 4.295743 0.0002175927 021121 :,:Hu Hu单边I: 012112 :,:HuHu单边 II: 1 新的操作对提高得率是否具有显著性? 0 yx P HP 成立,说明H0小概率事件发生了,忽略H0,接受H1 也即,新操作不如旧操作是否是小概率偶然事件, H0是不是小概率事件? 问题重点 : 第16页/共30页 2222

15、0010 :,:HH单边 II: 2222 0010 :,:HH双边: 2222 0010 :,:HH单边I: 已知时: 未知时: 22 1 ( )n 单边 II: 2222 /21/2 ( ),( )nn 双边: 22 ( )n 单边I: 22 1 (1)n 单边 II: 2222 /21/2 (1),(1)nn 双边: 22 (1)n 单边I: 2 22 2 0 (1) (1) nS n 2 22 2 0 ( ) n n 第17页/共30页 chi2-df*S2/sigma2; P0.05,不能拒绝H0,接受H0, =149 var.test1(x,sigma2=75) var df ch

16、isqz P_value 1 77.73 19 19.693 0.826 0.05,不能拒绝H0,接受H0, 2=75 第19页/共30页 3)单侧检验II:H0:p p0;H1:pp0 1)双侧检验:H0:p=p0;H1:pp0 n已知,对p检验: k p k1-/2k/2 拒绝域 00 1 /(1) 2 (1) 2 k iin i n i C pp 由:解得分位点 /21/2 kk 和 拒绝域: /21/2 kkkk 00 1 (1) k iin i n i C pp 由:解得分位点1 k 拒绝域: 1 kk 拒绝域:kk 第20页/共30页 H0:p=p0=0.85;H1:pp0 Des

17、cription Performs an exact test of a simple null hypothesis about the probability of success in a Bernoulli experiment. Exact Binomial Test Usage:binom.test(x, n, p = 0.5, alternative = c(two.sided, less, greater), conf.level = 0.95) x number of successes, or a vector of length 2 giving the numbers

18、of successes and failures, respectively. nnumber of trials; ignored if x has length 2. p hypothesized probability of success. alternative indicates the alternative hypothesis and must be one of two.sided, greater or less. You can specify just the initial letter. conf.levelconfidence level for the re

19、turned confidence interval. 第21页/共30页 sample estimates: probability of success 0.89 binom.test(445,500,p=0.85) 0.25(单侧检验) binom.test(5,10,p=0.25,alternative = greater) p-value = 0.07813 0.05,接受H0,他是瞎猜的,不能录取. binom.test(6,10,p=0.25,alternative = greater) p-value = 0.01973 pro 1 0 拒绝H0,认为消费者对5种品牌 啤酒的喜

20、好有明显差异. H0:喜好5种啤酒的人数服从均匀分布 第25页/共30页 xa vector or matrix. ya vector; ignored if x is a matrix. correct a logical indicating whether to apply continuity correction when computing the test statistic for 2x2 tables: one half is subtracted from all |O - E| differences. No correction is done if simulate.

21、p.value = TRUE. p a vector of probabilities of the same length of x. An error is given if any entry of p is negative. rescale.p a logical scalar; if TRUE then p is rescaled (if necessary) to sum to 1. If rescale.p is FALSE, and p does not sum to 1, an error is given. simulate.p.v alue a logical indi

22、cating whether to compute p-values by Monte Carlo simulation. B an integer specifying the number of replicates used in the Monte Carlo test. 第26页/共30页 x=c(25,45,50,54,55,61,64,68,72,75,75,78,79,81,83,84,84,84,85,86,86,86,87,89,89,89,90,91,91,92,100) a=table(cut(x,br=c(0,69,79,89,100) p=pnorm(c(70,80,90,100),mean(x),sd(x) p=c(p1,p2-p1,p3-p2,1-p3) chisq.test(a,p=p) p=pnorm(70,mean(x),sd(x) p=pnorm(80,mean(x),sd(x) p=pnorm(90,mean(x),sd(x) p=pnorm(100,mean(x),sd(x) #1, 2, 3, 4pppp Chi-squared test f

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论