数据分析与R语言实现01_第1页
数据分析与R语言实现01_第2页
数据分析与R语言实现01_第3页
数据分析与R语言实现01_第4页
数据分析与R语言实现01_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据分析与数据分析与R语言实现语言实现第一讲第一讲多层模型多层模型使用使用统计方法,有目的地对收集到的数据进行分析处统计方法,有目的地对收集到的数据进行分析处理,并且解读分析结果理,并且解读分析结果 。数据分析数据分析常用算法常用算法数据分析工具数据分析工具数据挖掘数据挖掘 数据挖掘是以查找隐藏在数据中的信息为目标的技术,是应用算法从大型数据库中提取知识的过程,这些算法确定信息项之间的隐性关联,并且向用户显示这些关联 数据挖掘思想来源:假设检验,模式识别,人工智能,机器学习 常见数据挖掘任务:关联分析,聚类分析,孤立点分析等等 例:啤酒与尿布的故事 例:Science的文章科学家摸索出大型科学

2、家摸索出大型数据集内的趋势数据集内的趋势展现层:报表与图形展现层:报表与图形老土的报表常见的报表 仪表盘 一些有趣的图表 某条微博的扩散路径 数据分析和数据挖掘(分析层)+报表(展现层) 我们课程的位置我们课程的位置 查看网络资料,了解下列问题: 1、什么是R语言? 2、R语言的起源 3、R语言的优缺点? 4、R软件的安装?R16R网络资源网络资源R主页主页: R资源列表资源列表 NCEAS /scicomp/software/rR Graphical Manual http:/bm2.genes.n

3、ig.ac.jp/RGM2/index.php统计之都统计之都: /QuikR http:/ 丁国徽的丁国徽的R文档文档: /R/R-doc/ R语言中文论坛语言中文论坛 /Rbbs/forums/list.page R 的的Windows图形用户界面图形用户界面 (RGUI)菜菜 单单按钮按钮命令行命令行绘 图 区R 管理的几个概念管理的几个概念使用期使用期 (Session): 启动启动R系统到结束系统到结束R系统之间的时间段系统之间的时间段对对 象象 (Object): 由由

4、R产生或处理的实体产生或处理的实体,包括变量、向量、矩阵、包括变量、向量、矩阵、组合、函数等组合、函数等历历 史史 (Histroy): R使用期间所应用的历史记录使用期间所应用的历史记录(XXX.Rhistroy)工作空间工作空间 (Workspace): 当前被存储对象的集合当前被存储对象的集合(XXX.Rdata)不但不但对象而且包含了对象的系统环境;当一次使用完毕要关闭对象而且包含了对象的系统环境;当一次使用完毕要关闭R时,时,R会询问是否保存工作空间会询问是否保存工作空间软件包软件包 (Package): 执行一定功能的函数、数据等的集合,一些执行一定功能的函数、数据等的集合,一些内

5、置于内置于R系统内,大部分外置于网络系统内,大部分外置于网络R R代码管理代码管理R 文件(对象)管理文件(对象)管理工作空间载工作空间载入和存储入和存储历史记历史记录管理录管理路径管理路径管理文件管理文件管理R 文件(对象)管理文件(对象)管理1. 工作路径工作路径: getwd() setwd(“aa:/bb/”)2. 导入导入 R code: source(“aa:/bb/XXX.r or XXX.txt”) 如果已设如果已设定是工作路径则定是工作路径则source(“XXX.r or XXX.txt”) 3. 存储工作空间存储工作空间: save.image(“XXX.Rdata”);

6、 导入工作空间导入工作空间 load(“XXX.Rdata”), 或者直接双击或者直接双击XXX.Rdata打开打开R界面,此界面,此时工作空间自动导入,工作路径默认为时工作空间自动导入,工作路径默认为XXX.Rdata存储时的存储时的工作路径工作路径4. 存储、导入命令行历史记存储、导入命令行历史记 savehistory(file=“XXX.Rhistory”) loadhistory(file=“XXX.Rhistory”)R 界面调整界面调整R 工作空间内对象和软件包显示工作空间内对象和软件包显示显示工作空间中的对象删除工作空间中的所有对象显示置入R工作空间的所有 Packagels(

7、)rm(list=ls()search()R 的的 Package 管理管理将 R 的library的package载入R工作空间library(“packagename”)从网络将外置的package载入R 的library从计算机硬盘其它文件夹的package载入R 的library24CRANThe Comprehensive R Archive Network简称CRAN,由世界几十个镜像网站组成网络,提供下载安装程序和相应软件包。各镜像更新频率一般为1-2天推荐镜像:中国的镜像:数学所/mirrors/CRAN/及时更新的CRAN源http:/cr

8、/综合性例子:综合性例子: 模拟产生统计专业同学的名单(学号区分),记录数学分析,线性代数,概率统计三科成绩,然后进行一些统计分析 help()函数函数R 语言语言寻求帮助寻求帮助R 语言语言创建向量创建向量 1:101:10-11:10*2a=2:20*2+1aa5a-5猜各行代码的结果是什么?以下的呢?a1:5a-(1:5)ac(2,4,7)aa5)awhich(a5)rev(),sort()函数a=1:10;arev(a) # reverse :倒过来a=c(2,3,5,8,1,9,2,4,3,2)sort(a)rev(sort(a)matrix()函数R

9、 语言语言生成矩阵生成矩阵x1=seq(2,12,length=5)x2=seq(3,15,length=5)R 语言语言矩阵运算矩阵运算函数函数t( ),矩阵加减,矩阵加减 矩阵相乘,函数矩阵相乘,函数diag( ) 矩阵求逆,函数矩阵求逆,函数rnorm( ), solve( ) R 语言语言解线性方程组解线性方程组函数函数solve(a,b) R 语言语言矩阵的特征值与特征向量矩阵的特征值与特征向量 函数函数eigen( ) R 语言语言数据框数据框矩阵形式,但列可以不同数据类型 每列是一个变量,每行是一个观测值 R 语言语言画散点图画散点图函数函数plot( ) R 语言语言读外部数据

10、读外部数据读文本文件读文本文件先设置工作目录,把文本文件放于该目录下 读剪切板读剪切板文本或excel的数据均可通过剪贴板操作 读读excel文件数据文件数据方法1:先把excel另存为空格分隔的prn文本格式再读 方法2:安装RODBC包,再通过ODBC读 R 语言语言分布函数分布函数 正态分布函数正态分布函数rnorm( ) rnorm( ) 泊松分布函数泊松分布函数rpois( ) rpois( ) 指数分布函数指数分布函数rexp( ) rexp( ) GammaGamma分布函数分布函数rgamma( ) rgamma( ) 均匀分布函数均匀分布函数runif( ) runif( )

11、 二项分布函数二项分布函数rbinom( ) rbinom( ) 几何分布函数几何分布函数rgeom( ) rgeom( ) 综合例子讲解综合例子讲解模拟产生统计专业同学的名单(学号区分),记录数学分析,线性代数,概率统计三科成绩,然后进行一些统计分析 。num=seq(10378001,10378100)x1=round(runif(100,min=80,max=100)x2=round(rnorm(100,mean=80,sd=7)x3=round(rnorm(100,mean=83,sd=18)x3which(x3100)=1001、模拟生产学号和三科成绩、模拟生产学号和三科成绩2、合成数据框并保存到硬盘、合成数据框并保存到硬盘data.frame()、write.tablex=data.frame(num,x1,x2,x3)write.table(x,file=E

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论