《高级心理统计十六讲》R示例及R-project介绍_第1页
《高级心理统计十六讲》R示例及R-project介绍_第2页
《高级心理统计十六讲》R示例及R-project介绍_第3页
《高级心理统计十六讲》R示例及R-project介绍_第4页
《高级心理统计十六讲》R示例及R-project介绍_第5页
已阅读5页,还剩32页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《高级心理统计十六讲》R示例

及R-project介绍2授课计划北大深圳研究生院

应用心理学专业

07-08学年《高级心理与行为科学统计》必修课*R示例较集中的章节#未完成部分实际讲授顺序互有前后1有限理性与方法、工具9*结构方程之前(PCA,EFA)2*单变量(抽样分布、假设检验、Power、区间估计)10结构方程(CFA)3*双变量(因果与预测、条件分布)11结构方程(多质多法、全模型、高阶因子、拟单纯型)4*多元回归的向量投影理解、哑变量、散点图12结构方程(多组、截距项、专题)5中介与交互13#多层分析(重测模型、数据格式变换)6*GeneralizEDLinearModel14*多层分析(一般模型)7#方差分析的回归检验视角15*缺失数据,相关系数,EffectSize8#GenerALLinearModel提要16结构方程相关的科学哲学论题3参加上机工作坊同学的预先准备访问/bin/windows/base/

下载最新版R-(版本号)-win32.exe文件安装安装后点图标运行。在联网条件下,点 PackagesInstallPackage(s)…如果弹出CRANMirror选择框,可单选Austria然后在弹出的Packages选择框里多选自己所需要安装的附加包,比如多层分析的nlme或lme4;缺失数据norm;结构方程的sem;可模拟多元正态分布数据的MASS;仿SPSS界面的Rcmdr。访问/R/R-doc/

下载参考书提取本页嵌入的PPTR代码可以浏览http://R-/

看看有哪些文档资源4五分钟的R-入门介绍所有R代码、大部分R文献都属于公共版权,其中若干著名的入门教材有华人学者贡献的中译本R的Windows界面ctrl-rctrl-lup-arrow/down-arrowtabeschelp.search(“要查找的词语”)?要查找的关键词demo(lm.glm);example(anscombe);Googlexxxsite:R-R文档中的例示R对大小写敏感5R(S)的语言风格函数调用(试试如果不输入括弧)函数包的调用install.packages();library(Rcmdr);data.framedf<-data.frame(x,y,…)write.csv(df,choose.files());read.csv(choose.files());面向对象编程风格Lm1<-lm(y1~x1,data=anscombe);methods(plot);plot(Lm1)就是plot.lm(Lm1)plot(anscombe)就是plot(anscombe,method=class(anscombe))向量和矩阵%*%66软件横比:互动效果互动效果:Excel>R(=S)>SAS>>SPSSclick-vs-code:SPSS和SAS一样难学、难教三个TA才能照顾20个学生(UCLA报告书)而编程难度与R同类的Stata常常只需要一个TA *这是因果分析么?R(S语言)的“缺点”不象SPSS一样帮助你不懂装懂报告的结果不是越多越好误解:R没有图形界面?J.Fox教授的Rcmdr

包77软件横比:文档与示例文档示例:R(=S)≈SAS>>Excel>SPSSR官方网站的捐献包都带有符合标准的文档和示例;“书要能从薄读到厚”(华罗庚)在量化方法学习上就对应于从概括描述构造练手的数据实例,获得感性认识研究者的思维方式是embodied而不是literal的(Mulaik,2004)88黑板和粉笔

vs.投影仪、PPTWorkingKnowledge习得全靠情境下的过手数学关系和结构只有通过构造复现才能真正理解听读vs说写--最好的学习(研究)环境是一个/伙好的学习(研究)伙伴99软件横比:图示功能图示功能R(=S)≈SAS>Excel>>SPSS“书…还要能从厚读到薄”(华罗庚),对应在量化方法学习上,就是从数据实例概括出扼要的图示“Graphicsbroadcast;statisticsnarrowcast.”(Wilkinson&APATFSI,p.597)

1010统计图的是与非Wilkinson&APATFSI(1999)建议提供残差图示而非定性的检验结论-统计图的黄金时代(Smith,Best,Cylke,&Stubbs,2000)Apictureisworthmorethanathousandp-values.–Loftus(1993)统计图的普遍误读一例(Belia,Fidler,Williams,&Cumming,2005)图间接引自Huff(1954)的畅销书1111R-project背景:开源软件与CC版权GNU’sGPL运动与CopyleftRhttp://R-

vs.S-plus;CalcofOpenOfficevs.ExcelofOfficePSPPvs.SPSSLinuxvs.WindowsStallman,R.像来自.ar/?m=200705

1212网络资源:CC版权创新与免费课件MIT的开源课件运动/OcwWeb/Brain-and-Cognitive-Sciences/9-07Spring-2004/Calendar/index.htm

/OcwWeb/Global/OCWHelp/avocw.htm

奇幻基金会倡导的中文翻译UCLA的统计工具咨询服务中心/stat/default.htm

/stat/seminars/default.htm中国国家精品课程导航/1313开源软件区别于盗版eMule或者BT的链接站点,比如verycd盗版执法中对下载源与下载的区别非常敏感学术资料交流站点比如盗版通常用会员制Windows系统恢复功能、“软件加油机”与限时试用版软件盗版背后的垄断地位竞争复印、扫描外文学术资料是大陆学界当下现实大陆盗版执法暂时还区分商业盈利与研究教学“好书自有pdf”1414市场、版权与价格国内求职:SPSS面试国际求职:SAS证书与面试量化方法教学与学术交流:R,Stata软件价格(学生价,07年4月数据) SPSS(80usd/年)>Mplus(195usd)>Excel(1300rbm?)>LISREL(120usd)>>SAS统计功能完整的学生版(60usd) >>R(0ForEver)“p=.01”ofHaller&Krauss(2002).

Tryiton-line/go.php?url=lixiaoxu/zsu03DEC

…Youcomparethemeansofyourcontrolandexperimentalgroups(say,20subjectsineachsample).Furthermore,supposeyouuseasimpleindependentmeanst-testandyourresultissignificant(t=2.7,df=18,p=.01).…Youhaveabsolutelydisprovedthenullhypothesis.Y/NYouhavefoundtheprobabilityofthenullhypothesisbeingtrue.Y/NYouhaveabsolutelyprovedyourexperimentalhypothesis.Y/NYoucandeducetheprobabilityoftheexperimentalhypothesisbeingtrue.Y/NYouknow,ifyoudecidetorejectthenullhypothesis,theprobabilitythatyouaremakingthewrongdecision.Y/NYouhaveareliableexperimentalfindinginthesensethatif,hypothetically,theexperimentwererepeatedagreatnumberoftimes,youwouldobtainasignificantresulton99%ofoccasions.Y/N1516--转引自Gigerenzer,Krauss,&Vitouch(2004)1717统计背后,说不尽的概率

图引自MITOCW/OcwWeb/Economics/14-30Spring-2006/CourseHome/index.htm

1802/16假设检验、区间估计之R示例经典N-P方案:实验前决定拒绝域和二择对立分布,推算并报告α和Power;实验后报告“显著与否”而非准确p值。不同效应量的对立假设Power不同;不同Power、不同主观概率,被说服程度不同。α=.05,Power=.8,H1主观概率为.22的例示19Prosecutor’sFallacy&Defendant’sFallacy(Thompson&Schumann,1987)10e7人口的城市中有唯一罪犯DNA比对巧合配对的概率是10e-4罪犯比对DNA一定配对某嫌疑犯DNA能够配对如果该嫌犯是现场的100人之一?/wiki/Prosecutor's_fallacy

20对经典N-P方案的改进意见报告显著性不如报告准确的p值

(Wilkinson&APATFSI,1999)如果报告准确p值,则不再报告仪式性的α(Gigerenzer,Krauss,&Vitouch,2004)报告实验效应的区间估计

(Wilkinson&APATFSI,1999)尽量报告散点图示

(Wilkinson&APATFSI,1999)不要报告PostHocPower/ObservedPower

(Hoenig

&Heisey,2001)21名义α=.05种种扭曲情形的习题某研究者每次都先看t统计量的符号再决定做何种单尾的检验,问其真实一类错误率(.10)某研究者每次都先看p值再决定报告尽可能小的名义α为.05或.01

,问其真实一类错误率(.05)某研究者每次都先看p值是否显著再决定是否最终报告其研究

,问其所有最终报告的所有研究中真实一类错误的比率(1.00?)某研究者对十个互相独立的变量分别做其分布的偏度检验,关于所有变量都正态的虚无假设,问其真实一类错误率(.60)某研究者每次都根据实验数据去设计对立假设,假定他可以选任意的对立假设,问其真实一类错误率(1.00?)验证性VS探索性研究22置信区间暴露的N-P方案悖论区间估计可处理连续效应量无数备择假设情形置信区间很窄但虚无假设在其外侧边缘的情形H0和H1分别在置信区间不同方向外侧的情形x<-seq(-5,5,length=500);d<-qnorm(0.025);plot(x,dnorm(x,mean=-d),type="l");lines(x,dnorm(x,mean=d),col="red");23不要滥用Power报告(Hoenig&Heisey,2001)当时,包括Science在内的19份知名学术刊物都不恰当地明文鼓励报告“后验”Power24RCode/articles/546464.html

FromPPT/RDSU/library/power.pdf

03/16双变量R示例旋转的散点图:0,30,45度2503/16预测可以反过来么?预测线(loess)≠旋转轴26Lord悖论x:R学习动机前测y:R学习动机后测z:性别组别##Testtworedregressionlinesconfint(lm(y~x+z+x*z,data=df));##Testtwogroupsof(y-x)

confint(lm(I(y-x)~z,data=df));27Lord悖论的反思什么是统计上的预测?可否用今天的考古数据预测历史上的人口数量?预测与被预测变量是否可以交换?预测是数据描述还是由果探因?什么是统计上的因果?是高相关?是时序先后+高相关?是双盲实验设计+达到显著性的任意相关程度?是先验信念+时序先后的异样观测?哪些结论来自理论?哪些来自经验?哪些来自实验设计、观测数据?2804/16回归R示例>?anscombeAnscombe(1973)29回归、方差分析都报告散点图(Wilkinson&APATFSI,1999)>points(X,predict(loess(Y~X)));30回归的Nominal自变量R示例corr(X,Y*)=.6Z=1{X>0}Y=Y*Z-Y(1-Z)

Y~X

Y~X+Z Y~X+Z+X:Z

X~Y+Z+Y:Z

X~Y+Z31Regression

Discontinuity

DesignR示例红线:真实y值绿线:loess预测线(≠线性预测线)兰线:

对照contrast组(不等于“控制control组”;Wilkinson&APATFSI,1999)和处理组的(无交互项)线性预测值--天文学能不能得到因果结论?3214/16EcologicalFallacyR示例高工资的公司,工资越高,疲劳程度越高,愉快程度越低;低工资的公司,工资越高,疲劳程度越低,愉快程度越高;3315/16EffectSizeR示例r受X范围影响;但by.x不受X范围影响bx.y受X范围影响34EffectSize的误解d,η2,R2--标准化的EffectSizeby.x

–“字面意义”的EffectSize …Alwayspresenteffectsizesforprimaryoutcomes.Iftheunitsofmeasurementaremeaningfulonapracticallevel(e.g.,numberofcigarettessmokedperday),thenweusuallypreferanunstandardizedmeasure(regressioncoefficientormeandifference)toastandardizedmeasure(rord).(Wilkinson&APATFSI,1999)35Rosenthal&Rubin(1982)的例子 d<-32;##Tryd<-20!

##toreducethedeathratebyd%, ##From

(50+d/2)%to(50-d/2)%

y<-c(rep("Live",50+d/2),rep("Death",50-d/2));

y<-c(y,rep("Live",50-d/2),rep("Death",50+d/2));

y<-(y=="Live");##TRUEvsFALSE

x<-c(rep("Treatment",100),rep("Control",100));

x<-(x=="Treatment");

##correlation^2

cor(x,y,method="spearman")^2

36Wainer&Robinson(2003)更极端的例子 y_1<-c(rep("NoHeartAttack",10933),rep("HeartAttack",104));x_1<-y_1;x_1[]<-"Aspirin";

y_2<-c(rep("NoHeartAttack",10845),rep("HeartAttack",189));x_2<-y_2;x_2[]<-"Placebo";

y<-(c(y_1,y_2)=="NoHeartAttack");##TRUEvsFALSE

x<-(c(x_1,x_2)=="Aspirin");##

paste("HartattackcasesarereducedRELATIVELYby",round((189-104)/189*100,digits=2),"%;whiler^2=",round(cor(x,y,method="spearman")^2,digits=4),",oronly",round(cor(x,y,method="spearman")^2*100,digits=2),"%variancehasbeenexplained.",sep="");37《R导论》(Venables&Smith,2006;丁国徽译,2006)欢迎参加《R导论》工作坊03Dec2007,19:00广州·中山大学·心理系38统计是—发现

与说服的工具用统计发现:Exploratorystudy用统计说服自己:Falsifiability用统计说服同行:ConfirmatorystudyObjectivity≈Inter-subjectivity+Replicability(Mulaik,2004)3940概率与统计的认知心理学苏格拉底式说服说教:用我的(庙堂的?)逻辑和认知说服你说服:用你的(常识的?)逻辑和认知说服你统计是说服同行的工具还是文献发表的仪式?“学界同行的认知”仍是凡人有限理性D.Kahneman和A.Tversky揭示统计预测的认知机制和概率、统计命题的本能误读(Kahneman,Slovic,&Tversky,1982;Kahneman&Tversky,1974)P.Suppes的五点量表式俭约主观概率模型(Salsburg,2001,p.307)4041概率的Bertrand悖论图引自Wiki/wiki/Bertrand%27s_paradox_%28probability%29

1.请一个人来任意画弦,画很多条,最后的长度分布会是什么?2.请一个人来赌某一条没看见的弦与灰线的短长,他的赔率会是多少?41421.3.2 宇宙论vs认识论Kolmogorov的概率公理体系把数学技术成分从哲学争辩中独立出来,使数学家、统计学家免责于哲学立场既不需要预设上帝投掷骰子,也不需要预设人类在观察经典的频率学派统计理论也不依赖观察者42431.3.3物理概率:决定论vs非决定论物理中的测不准原理不回答宇宙的决定论问题,只涉及观察者的认识论问题想像一个不确定的世界想像一个确定但却不可确知/观测的世界决定论问题独立于人生态度问题因为一切已命定,故无可为因为一切已命定,故必有可为4344R适用的背景:量化研究方法的有限理性Simon,H.(司马贺)1975,TuringAward1978,NobelPrizeKahneman,D.(withTversky,A.)2002,NobelPrize4445量化认知限度的心理学研究 记忆的参数——五秒,2-7块从蚂蚁有限的理性到CPU无穷的运筹

…一个人,若视作行为系统,是很简单的。他的行为随时间而表现出的表面复杂性主要是他所处环境的复杂性的反映…--Simon,H.《人工科学》有限理性的空间运筹4546H.Simon’sWatchmakerParable

……他们做的表由约1000个零件组成。坦普斯如果尚未装成一只表就不得不中途放下(比如说去接电话的时候),那么它立刻散掉,又得从头装起。顾客们越喜欢他的表,他的电话就越多,他就越难得到足够的不被打断的时间来装成一只表。

46

霍拉做的表并不比坦普斯的简单。但他经过设计,可以用十个零件装成一个组件。十个组件又可装成更大的组件。十个大组件构成的系统就是整只表。因此,当霍拉不得不放下装了一部分的表去接电话时,他只损失了一小部分活儿,他装表所用工时只是坦普斯所用工时的一个零头……

--Simon,H.《人工科学》

47近可分解系统与复杂性的模块化

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论