北大心理统计知识点总结统计-第十章卡方和二项检验_第1页
北大心理统计知识点总结统计-第十章卡方和二项检验_第2页
北大心理统计知识点总结统计-第十章卡方和二项检验_第3页
北大心理统计知识点总结统计-第十章卡方和二项检验_第4页
北大心理统计知识点总结统计-第十章卡方和二项检验_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、统计第十章卡方和二项检验方检验F面的数据用什么统计方法?研究学业成就和自尊的关系被试学业成就自尊A9431B7826F面的数据用什么统计方法?学业成就高成就低成就3126自尊分数2923F面的数据用什么统计方法?n=150自尊水平高中低学业成就高173211低134334参数与非参数检验参数检验用于等比/等距型数据对参数的前提:正态分布和方差同质非参数检验不用对参数进行假设对分布较少有要求,也叫distribution-free tests用于类目/顺序型数据 没有参数检验敏感,效力低因此在二者都可用时,总是用参数检验卡方匹配度检验定义用样本数据检验关于总体分布的形状或比率假设。检验样本的分布

2、比率与 假设的总体分布的比率匹配度。是对次数分布的检验研究情境在医生职业中,男的多还是女的多?在三种咖啡中,哪种被国人最喜欢?在北京大学中,各国留学生的比例有代表性吗?卡方匹配度的虚无假设(1)无偏好假设分类之间没有差异例如对保洁公司的洗发水品牌的爱好海飞丝沙宣潘婷1/31/31/3卡方匹配度的虚无假设(2)与参照群体无差异60%哈佛学生对本部食堂的伙食满意,40%哈佛学生对本部食堂的伙食满意。哈佛学生对1食堂的伙食的满意度是否与对 2食堂的满意度是否有差异?满意不满意HO:60%40%观察次数观察次数样本中分到某一类别的个体的数目。每个个体只能分到一个类别。用人格量表对被试施测后将被试分成3

3、类男性化双性化女性化15196n=40期望次数由虚无假设和样本的大小决定男性化双性化女性化25%50%25%10201040卡方匹配度检验的公式X 2=刀(fO-f e)2/ f ef e=pndf =C-1F0:观察次数f e :期望次数C:类目的个数X 2:统计量卡方分布的性质(1)卡方分布不是一个对称的分布,正偏态 随着自由度的增加越来越对称Not symmetric八All values are nonnegativedf=io05 10 15 20 25 30 35 40 45卡方分布的性质(2)卡方的值是0或者是正数,不可能是负数。自由度(n-1)不同,卡方分布也就不同。因此,卡方

4、分布是一系列的曲线。随着 自由度的增加越来越接近对称。卡方值卡方值越小,越接近零,虚无假设正确的可能性越大,观察次数和期望次数之间越接近类别的数量对临界值的影响临界区域(Critical Region)例子1 (数据虚构)对保洁公司的洗发水使用者的爱好在品牌上是否有差异?调查了90人品牌海飞丝沙宣幡婷喜欢的 人数40153590人例1的解答stepl虚无假设H0:保洁公司洗发水的消费者对3种品牌的偏好没有差异。step2找临界值 df=3-1=2, a =.05, x 2的临界值为 5.99step3计算海飞丝沙宣燔婷40 (30 )15 (捌)35 (30)102/30=3.33(-15)2

5、/30=7.552/30=0.83x 2= 3.33+7.5+0.83=11.66,拒绝 HOstep4结论 保洁公司洗发水的消费者对3种品牌的偏好有差异。解题的步骤1. 描述假设2. 计算df值,a水平,确定临界值3. 计算f e和卡方值4. 得出结论(接受或拒绝H0)例2 (数据虚构)60%北大学生对本部食堂的伙食满意,40%北大学生对本部食堂的伙食满意。调查了 100名在万柳就餐的学生,40名学生满意,60名学生不满意。问北大学生 对万柳食堂的伙食的满意度是否与对本部的食堂的满意度是否有差异?例2的解答H0:北大学生对万柳食堂的伙食的满意度与对本部的食堂的满意度没有有差异df=2-仁 1

6、, a =.05, x 2 的临界值为 3.84满意不满意40 (100X60%)203/60=6.6660 (100X40%)202/40=10x 2= 6.66+10=16.66,拒绝 H0北大学生对万柳食堂的伙食的满意度与对本部的食堂的满意度有差异APA对报告卡方统计结果的格式要求 范例The stude nts showed a sig ni fica nt prefere nee on the questi on concerning factors involved in course selection, x 2(3,n=50)=8.08,pv.05.自由度,样本的大小,卡方值,

7、a水平要提供每个类别的观察次数,用一个简单的表描述。卡方独立性检验检验行和列的两个本来变量彼此有无关联例如心理学系学生的性别(男、女)和毕业意向(出国、上国内研究生、工 作)的关系。用你已经学的统计方法能解决这个问题吗?两种卡方检验的区别和共同点区别变量数共同点都是检验观察次数和期望次数之间的接近程度。卡方独立性检验例子人格和颜色偏好的关系红黄绿蓝103152250外向90172518150100204040n=200卡方独立性检验的虚无假设形式1对于普通的学生群体,颜色偏好和人格之间没有关系 形式2对于普通的学生群体,在两种人格类别中颜色偏好有同样的分布形态(或 比例)。两种虚无假设是等价的

8、同样的比例意味着没有关系60%的外向被试喜欢红色,60 %的内向的被试也喜欢红色卡方独立性检验的公式X 2=刀(fO-f e)2/ f e f e= ( row total) (column total) /n df = (R-1 ) (C-1)F0:观察次数f e :期望次数R :行类目的个数C:列类目的个数X 2:统计量公式的推导和记忆人格和颜色偏好的关系红 黄 绿 蓝内向外向10020404011=200对于普通的学生群体,在两种人格类别中颜色偏好有同样的分布形态(或比例) 按照虚无假设,空格里应该是什么?红 黄绿蓝内向外向X1?x2x3x4yiy2y45015010020404011=

9、200H0:x1:x2:x3:x4=y1:y2:y3:y4 x1:x2:x3:x4=(x1+y1): (x2+y2): (x3+y3): (x4+y4) x1:50=100:200x1=50*100/200=25自由度红黄绿蓝内向25510950外向99150100204040n=200计算过程红量绿蓝df=(R-1)(C-1)下表中三个期望次数确定,其他期望次数都确定內 向10( 25)C 45P/25-93(5)0.815C 10)22( 10)14490(75)317( 15)0 26好C 30)18(30)451002040外向ii=200Df=3, a =.05, x 2 的临界值为

10、 7.82x 2=9+0.8+2.5+14.4+3+0.26+0.83+4.8=35.59拒绝H0,对于普通的学生群体,颜色偏好和人格之间有关系例3调查了 n=200个不同年龄组的被试对手表显示的偏好程度数字显示钟面显示不确定30岁或以下90401030岁以上104010例3的解答Ho :对手表显示的偏好程度与被试的年龄段无关df=(R-1)(C-1)= (3-1)(2-1)=2 , a =.05, x 2 的临界值为 5.99数宇显示钟面显示不确定行的和如岁以下30(70)20-/70=5.7140(56)10(14)14030岁以上1QG3U)-20)-00=13.3340(24)1 翊4

11、=10,6710(6) 4JB=2760列的和10080120200x 2=5.71+4.57+1.14+13.33+10.67+2.67=38.09拒绝Ho,对手表显示的偏好程度与被试的年龄段有关卡方检验的前提观察的独立性每个被试只能提供一个数据期望次数的大小不能小于5小于5太敏感(5-1) 2/仁16(14-10)2/10避免这种情况的方法增加样本容量二二项检验(The Binomial Test)二项分布(Binomial Distribution )如果在某种特定的情境下,只有两种可能的结果.其结果就形成一个二项分布例如,投掷硬币得到正面或反面,对是否题的回答,一个人的生或死等等 二项

12、分布表示为:B(n,p),其方程非常复杂。如果n足够大,二项分布可以近似为正态分布。二项分布的概率两个类目:A和Bp = p(A) = A的概率q = p(B) = B 的概率p + q = ? 1.0n =样本中所包含个体(或观察)的数目X =样本中事件类目A发生的数目二项分布表达了与从X = 0至U X = n的每一个X值有关的概率。例1天气:假设9月份降水概率为 0.40。30天的降水次数为X, 20年中降水次数的分布为二项分布P=0.40 , q=0.60 . n=30X取值范围从0到3020年X值为15, 18, 11, 12, 11, 16, 14, 12, 10, 12, 13,

13、 14, 13, 14, 12, 8, 9, 10, 12, 13。假设n = 2 (即,将硬币掷2次),有多少可能的结果B(2, 0.5)? -4 .第1次第2次正面次数正Bi2正面反盲1正面10两次掷到正面的概率是多少 ? 掷不到正面的概率是多少 ? 只一次掷到正面的概率是多少 ? 至少一次掷到正面的概率是多少?2n假设n = 6.有多少可能的结果? 64种(公式是:)fisA百:ft t6&壬反西直百百- a t4正正正正&fifififi百 t3正正正正 反h血丽両:ii SJ正正JE匹 反20161240.31750,1875012500.0625什么条件下,二项分布可以近似为正态分

14、布?看n = 6时的情况 (pn = .5*6 = 3).当n足够大(pn 10)和(qn 10),二项分布可以近似为正态分布 二项分布的均值和标准差Mean:Standard deviation: c =公式的变形 Hpl pif It利用正态分布表求二项分布的概率正态分布中 X的值是一段,而并非一点,所以当二项分布近似为正态分布时,需 要考虑精确上下限。因为我们是在用连续型分布(正态)来估计离散型分布的值例1:有时学生入学后会中途退学.如果每个人中途退出的概率是0.10,在100人的班上,1. 有不少于15个学生退学的概率是多少?2. 有多于15个学生退学的概率是多少?n = 100 p

15、= 0.10 q = 0.90np = .10*100 = 10 nq = 90mx = pn = 10sx = sqrt(npq) = sqrt (100*.10*.90)=sqrt (9)= 31. p(X 15 的精确下限)=P(X 14.5)=P(Z 14.5-10) /3.0= P(z 1.5) = 0.06682. p(X 15 的精确上限)=P(X 15.5)=P(Z 15.5-10) /3.0= P(z 1.833) = 0.0335例2 :假设你参加一个 48道题的多项选择题测验,只有4种可能的答案.你全凭猜测作答. 猜对14道题的概率是多少?p = P(正确)=1/4q =

16、 P(错误)=3/4 pn = (1*48)/4 = 12qn = (3*48)/4 = 36pn和qn都大于10,所以可以假定分布近似正态.分数14其实是对应 从13.5到14.5之间这段距离-12=sqr(48*. 25*. 75) = sqroot (9)=0. 50 一0.眈 5=0 83 - 0.2033两个E分数间的面积是:0.3085 - 0.2033 = 0,1052二项检验的做题过程The population of sludcnts in (he psychology department at the Slate College consists of Mq female

17、s and 4(1malc List xvmester the psychokig) of gcnikr course hai a kUul of 6 ytudenh. ol hoin 26 crc lenijlc und only 10 were itiak. Are the proportions of knidles and males in the gcikkr cI;lssdifterciit irotn whiii would be cx-pe i that lhe pixiurtians for Ulis 】;】、arc dillcrent from the c popuhlhm

18、 proptrtiuiis.Hx . p = 0.6(1 (汕d q 工 1).4()We will set 3lph;i ul =川工nrSTEP 2 I.tnme lhe Lhiictil nituL BcClLiisc /h) lhuI l/j urc both rcAicr iltin HK we vjii iixc ihu normal dppioviimlton io tlic NikhiiuI dihthtitKMi. W ilh it - .0?. lhe criiiiLtl ivukmi i、 JcliiKil ;i、iiny ,7-coiv Vdltw givnkr Hun

19、 + 1,9和 n kss thjn -STEP 3( uh ulute rhe u1 he simple h; 2h knttlcs oui ol 扑 Mudenis. w th simpleproporiion i%The eonrspofldi:*g 二w*】叫,equation IX.21 isA.jj - p 0.72 -().12* “Z - - =1.4/、丹 FJ/01141(14()1 讪用 |心STEP 4 Md/ic u ikx iyfin uh(mf ?/h(ntif Mure a curuhtyfuti. Tile tuirted rMore is not in th

20、e i rilicul ition. Hiereiorc, we fjil 协 jcrecl lhe null liypuiJic.r On the b.bi nf thi: diitii, yoti condudc Ihut tlu? nialc tensile proportknis in the cndei l kiss six: not Miiniii- k .Eiitly Llillcicnl liom (he profortio齡 in the p$ych“leg ik?p.irtnieril ;i whdlc用论文形式报告结果Three out of 27 in Lints mo

21、ved lhe deep skk of the x tsual clifi? A binornijl text icvcukd thrf there is significant pcefennoe for the shallow side of the clifT. z 4J04, p . Ihcrctore. any change in a subjeet score is due(0 dtinec. In terms of probabilities, tlii$ jueins Lh;it increases acul decreases arc equal lx likclv. sop

22、 = /Xincreasi?) = 4 (/ = /devre;e)= r例题A researcher 忙、l、tli ellcvl of a rewaled Ihul 23 people Jost weight and 13 people ynmed weightSTEP 1 Stale the hypMhois. I he miLI hy pothesis kites duil die diet h;i、iiu cJlccl. Any cluniic m weiuhl is due tt ulumce uicreads jtk) itccrcio ;i餐 ci|u;illv Eikclv Fxpresed js

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论