版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
R语言统计分析易楠张青青R语言简介集数据分析与图形显示于一体的统计编程软件。由Auckland大学统计系的RobertGentleman和RossIhaka于1995年创立的。免费下载地址其它统计软件SAS:世界上最权威的统计软件,价格昂贵,支持编程,统计学专业专用软件SPSS:操作容易、输出漂亮、功能齐全、价格合理,非统计学专业首选软件Eviews:具有强大的多元回归和时间序列分析功能,计量经济学专业专用软件Matlab:功能强大的编程软件,统计分析功能较少,工程专业首选软件Excel:具有简单的统计分析功能,商务办公首选软件通病:&“黑匣子”“傻的可爱”函数结构function_name(Arguments1,Arguments2=value,…)function_name表示函数名称Arguments1表示需输入的数值,可能是向量、数据框等Arguments2=value表示参数2的取值,可能是逻辑变量等例:函数read.table(file,header=F)read.table表示读入文本数据函数名参数file表示被读取的文本文件名“**.txt”header表示数据文件第一行是否包含变量名,如果包含则输入header=F,否则输入header=TR中的一些基本运算的语句1、变量与赋值使用者可以用“=”或“<-”来将数值赋予给一个变量。任何英文字母、数字、“.”都可作为变量名称。但是第一个字母必须是英文字母。R容许变量名称中有空格。例如:如果要给变量x赋予数值9,只需输入:>x=9或>x<-9>sqrt(x)[1]3>Y=(5*(x+2))-3>y[1]52运算中是不会影响x的数值,倘若想重新给x赋值,可参考下列例子:>x=sqrt(x)>x[1]3R中的一些基本运算的语句2、向量在统计学中,多数数据都是以一组来表达,即向量的形式。R中,使用者能以向量形式来输入一组数字。举例来说,在一次重复试验中得出以下10个结果:2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1若想将其以一个向量的形式表示出来,可参考如下:observations=c(2,4.6,1,3.7,5.9,4.0,6.7,2.8,1.4,3.1)C()表示R中在括号中的数值是以向量形式输入的。向量的运算与标量的相同,如:2.54*observations输出结果为向量中的每一个数值均乘以2.54,然后再以向量形式输出利用R,通过定义成向量的形式,我们可以很方便的计算出上述一列数据的均质和方差,如:Mean(observations)Var(observations)4、矩阵矩阵和向量有点相似,但它是二维的。输入矩阵如同输入向量,只需加上它的二维数据。矩阵拥有两个属性:“二维数据”和“行和列的名称”。例如:A=atrix(c(1:9),nrow=3,ncol=3,byrow=T)[,1][,2][,3][1,]123[2,]456[3,]789上述例子中,自变量“byrow=T”提示R以一行行来排列矩阵。当矩阵的第一行被填满时,余下的数字将填补下一行,如此类推,直至完成矩阵。byrow默认值是“F”,因此,若不输入自变量“byrow=T”,则会被视为以下列方式组成矩阵:[,1][,2][,3][1,]147[2,]258[3,]369>dim(A)函数dim能显示矩阵的二维数据[1]334、矩阵的合并5、数据框矩阵和向量一样,只能拥有一种数据类型,而数据框却能同时拥有多种。若数据框内同时含有文字,当数据框被转化成矩阵时,所有元素都会被转化成文字。利用指令as.frame,可将矩阵转化为数据框。例如:数据框的引用数据框数据的调用用attach命令有兴趣的同学可以试着做:高一成绩与收入水平的kendall相关系数,并思考为什么不能使用pearson相关系数分析?相关分析R与SPSS对比R输出结果SPSS输出结果回归分析描述变量之间具体的变动关系,通过控制或给定自变量的数值来估计或预测因变量可能的数值。函数名:lm(formula,data)数据文件:earnings.txt程序命令:earnings=read.table("earnings.txt",header=T)lm1=lm(income~industry+service,data=earnings)summary(lm1)回归分析R与SPSS对比R输出结果SPSS输出结果残差检验正态性检验程序命令:shapiro.test(lm1$res)t.test(lm1$res)残差序列满足εt~N(0,σ2)序列相关检验(D.W.)程序命令:library(car)durbin.watson(lm1)残差检验自相关系数(ACF)程序命令:acf(lm1$res)偏自相关系数(PACF)程序命令:pacf(lm1$res)残差序列满足0均值、同方差、无自相关,即白噪声序列判别分析根据观察或测量到若干变量值,判断研究对象属于哪一类函数名:lda(x,grouping)数据文件名:disc.sav分析方法:距离判别法library(MASS)library(foreign)disc=read.spss("disc.sav",to.data.frame=T)lda1=lda(disc[,-1],disc$GROUP)table(predict(lda1,disc[,-1])$class,disc$GROUP)plot(predict(lda1,disc[,-1])$x,col=as.numeric(disc$GROUP))判别分析R与SPSS对比R输出结果SPSS输出结果主成分分析利用降维的思想,把多个指标转换成较少的几个互不相关的综合指标的统计方法函数名:prcomp(x,
scale=F)
数据文件名:company.txt分析方法:从相关矩阵出发程序命令:company=read.table("company.txt",header=T)prc=prcomp(company[,-1],scale=T)summary(prc)prc$rotationprc$x[,1:2]主成分分析R与SPSS比较R输出结果SPSS输出结果因子分析探讨存在相关关系的变量之间,是否存在不能直接观察到但对可观测变量变化起支配作用的潜在因子的分析方法函数名:factanal(x,factors,rotation="varimax")数据文件名:student.sav分析方法:极大似然法、方差最大正交旋转、回归法程序命令:library(foreign)student=read.spss("student.sav",to.data.frame=T)factanal(student,2,rotation="varimax",scores="regression")因子分析R与SPSS对比R使用mle方法估计参数,默认因子旋转方法为方差最大化R输出结果
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年互联网医疗解决方案技术合作协议
- 2025年双方协商劳务派遣协议
- 2025年PPP项目合作财务管理协议
- 主材供应及合作框架合同 2024年版一
- 2025版区块链技术应用合伙人合作协议3篇
- 2025年度智能建筑安装工程承包技师合同4篇
- 二零二五年度酒吧食品安全管理与承包合同
- 2025年度城市公交车定点维修与应急保障合同
- 二零二五年度汽车维修免责声明适用于车主自带配件
- 2025年度地铁隧道钢筋工劳务施工安全质量保障合同
- 建筑结构课程设计成果
- 班级建设方案中等职业学校班主任能力大赛
- 纤维增强复合材料 单向增强材料Ⅰ型-Ⅱ 型混合层间断裂韧性的测定 编制说明
- 习近平法治思想概论教学课件绪论
- 宠物会展策划设计方案
- 孤残儿童护理员(四级)试题
- 梁湘润《子平基础概要》简体版
- 医院急诊医学小讲课课件:急诊呼吸衰竭的处理
- 肠梗阻导管在临床中的使用及护理课件
- 小学英语单词汇总大全打印
- 卫生健康系统安全生产隐患全面排查
评论
0/150
提交评论