数据挖掘试验报告试验一i_第1页
数据挖掘试验报告试验一i_第2页
数据挖掘试验报告试验一i_第3页
数据挖掘试验报告试验一i_第4页
数据挖掘试验报告试验一i_第5页
已阅读5页,还剩4页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、数据挖掘实验报告实验名称:实验二实验环境:RStudio指导教师:县珏专业班级:姓名:学号:实验日期:2016年10月14日实验报告日期:2016年10月15日成绩:实验、实验目的1、 R语言初步认识(掌握R程序运行环境)2、 实验数据预处理。(掌握R语言中数据预处理的使用)对于给定的测试用例数据集,进行一下操作。1)、加载程序,熟悉各按钮的功能见下运行结果2)、熟悉各函数的功能,运行程序,并对程序进行分析。对餐饮销量数据进统计量分析,求销量数据均值、中位数、极差、标准差,变异系数和四分位数间距。实验代码:#餐饮销量数据相关性分析#设置工作空间setwd("d:/dmex1/ex1/

2、ex1/示例程序")#读取数据cordata=read.csv(file="./data/catering_sale_all.csv",header=T)#求出相关系数矩阵cor(cordata,2:11)实验结果:-力网既川H刖庶U4餐住工>赛丁昨辛闻itsLwdQ"tJJCilluXJ,vX.L'七/5F刚才上印'、>1Tlint仙IMac<o«"dacjl-r*sAcd.cswfrFI1g.1sz日=七n/fdtariings口_三11,csw"(山口二丑口厂丁)>*水出值美累敛

3、地睡百谷叁总同爪及基茶拆百读金银茸计型排号nnsn明/区;+州掘iE生炒ft心忤幡商范口窗吉雨韭燕陵H曾步上隹廊汁雨呻亲心咨邮泵am在总相若水感悸H中胜百党鸿童汁烟混也生烛圣心目柄al?u仃番前韭裴溢工E'(:'I.<而叶而峰亲心有力京留同Jit1.OGOCOOOQO口口。口93口5aH¥O.Di6793326O.455.63B1&6O.3OSd55§30.2Q4A47840I0,1274324Q00755180«4Z3L«26Qi生炒禁心Q.30049530一1SCM43E-O.Ifi42«73O.324617b

4、A1-OOOOOOOOQ.3978:749.O.048980©Q+1Z2907Z9*B?焦杳的;五金银蒜>1"越排&于.即白城鸣西才煽假包1.ooooaooooQ.304434367-O.01227«3S9iNA-O.±0046360O.0260*140O.06224.44520UQLdF9933O,45038173.04434370122756NAJ.a00000000Ox0351L3460NAO.03S1U6O1.OOOOOOOOiNANANAJ.-0.2百通2$才才0.3t25d1T2mA(J-1872715SO.2«761

5、«7N4O.12154242一口一口后喜以后64NmaQ.2027632-tt3O7FI5O011%8048"了Q.QWQ7437驻娠附凝日*番加韭饯者M舞卜-0BO302220O.421775<原讣Iff袜泵心。一工口一口026100140.J-&727X55O.737f91耳,O.O.06234445O.±2154143-O.O0Sfi430口。口工73%、O.27027633OB077SOa±±-0.0302205。工42B110240.D2CM621502507437Ch.42107705NAo.SGrazag1.OOOg

6、QQOO.09S54200q.i5mr/Q-55733190NAO.O3S213iSO,085430。1-OOODOOOOO.17813563Q.049*6SB&9NAOPOdflafl&OGXS79755O.:L了e王6三1OOOOOOOQ6940938工NAOrQ+5据力江9。t1.04。右色:6m。*OaB9BQZ?aOQQQQQOO实验代码:# #设置工作空间setwd("d:/dmex1/ex1/ex1/示例程序")# 读入数据saledata=read.table(file="./data/catering_sale.csv"

7、,sep=",”,header=TRUE)sales=saledata,2# 统计量分析# 均值mean_=mean(sales,na.rm=T)# 中位数median_=median(sales,na.rm=T)# 极差range_=max(sales,na.rm=T)-min(sales,na.rm=T)# 标准差std_=sqrt(var(sales,na.rm=T)# 变异系数variation_=std_/mean_# 四分位数间距q1=quantile(sales,0.25,na.rm=T)q3=quantile(sales,0.75,na.rm=T)distance=q

8、3-q1a=matrix(c(mean_,median_,range_,std_,variation_,q1,q3,distance),1,byrow=T)colnames(a)=c("均值","中位数","极差","标准差","变异系数","1/4分位数","3/4分位数","四分位间距")print(a)实验结果:=|I-J.,Ti,下*4»丁一丁4P>弁在设由工作三间>sctwdf'M:drm,exl

9、j示喇程.苧")>#误入教掘> saldaraBr&ad.t3blef'ile>b/data/caterin_sale.csj","Tti«ader>TRJE)> salesalBdafab2> #统计复分析> 步均值、<=ian_=m4胃门(£31r%p«Trnfcir)> #中位物> median_=niedian(salessna.rni=T)> #林差> ranae_=T)aK(与aps?na.rm=T)-minCsaes3.rm=T)&g

10、t; #板唯萋> sttL=bqrtCvar(sdles,n<a.rtiF=T)> #变异系it> variat-lon_=std_/nean_> #四分位赳间距> qi-quarEl1&Csa'les,o.Z3lna.r»-T)> q3=quanti1e(5alest0.75,na+rn=T)> distance-ql-ql> ii=fliATri(n»4n_,Rfr£lin_,rango_Istd_,var13tinn_hql,qW,distarrf)hl,byrowT)> 匚口1门8

11、金6)=匚(”均值“中位我”j极差二标卷差,,f导系ir,u/4分旅物w4分位tr,“四分位目用口> primfa)均值中位数右差标港差变异系勤LT方伍封普4分电数四分忙间距1J27S5.2LS2655.65&O&4_447S1.O20.2725S4S245L.075203C.125574.1S对餐饮企业菜品的盈利贡献度(即菜品盈利帕累托分析),画出帕累托图实验代码:#设置工作空间setwd("d:/dmex1/ex1/ex1/示例程序")#读取菜品数据,绘制帕累托图dishdata=read.csv(file="./data/caterin

12、g_dish_profit.csv",header=TRUE)barplot(dishdata,3,col="blue1",names.arg=dishdata,2,width=1,space=0,ylim=c(0,10000),xlab="菜品",ylab="盈利:元")accratio=dishdata,3for(iin1:length(accratio)accratioi=sum(dishdata1:i,3)/sum(dishdata,3)par(new=T,mar=c(4,4,4,4)points(accratio*

13、10000c(1:length(accratio)-0.5),new=FALSE,type="b",new=T)axis(4,col="red",col.axis="red",at=0:10000,label=c(0:10000/10000)mtext("累积百分比",4,2)points(6.5,accratio7*10000,col="red")text(7,accratio7*10000,paste(round(accratio7+0.00001,4)*100,"%")

14、实验结果:> 卡设置工作空间、#就取次品都推肃制帕多托目> dishrlar?i=rpd,rsv(f11c="./riatang_clj<h_prr.csv",h4*iflpr=TELJt> barpl3Hcol="bluel",names.shidata.2pw1dtlt=L,5pace=o,y11nt=£to,iotot),Klab="菜品"ylaUY利:元> dccrat1o=dIshCiia,31>for【iin1;Itngthfaccr+_ratiutdiahddLa:t.3).

15、sufi(d1shdata,3i+)> pa(nu*T,m口r-«W*4H)> point5(accratio*10000口wwth(accrxtio)0,5),ncvk-rALSE,type-,rb'T+new-T)> axi5(4,col-"rcdrhcoT*axi5-"red",3t-C:10000,1abel-c(O:lC0Q0/10000)> 毗电父«“累租百分力> polnts6.i(accrsfio7J130001col-'red'> TPKttZ.accratiot/J

16、lOCiOD,pastefreurdtaccratia7j-kU.00001IKI菜品6中*,眄口.f3)、据预处理缺省值的处理:用均值替换、回归查补和多重查补对缺省值进行处理实验代码:#设置工作空间setwd("d:/dmex1/ex1/ex1/示例程序")#读入数据saledata=read.csv(file="./data/catering_sale.csv",header=TRUE)#缺失值检测并打印结果,由于R把TRUE和FALSE分别当作1、0,可以用sum()和mean()函数来分别获取缺失样本数、缺失比例sum(complete.case

17、s(saledata)sum(!complete.cases(saledata)mean(!complete.cases(saledata)saledata!complete.cases(saledata),#异常值检测箱线图sp=boxplot(saledata$"销量",boxwex=0.7)title("销量异常值检测箱线图")xi=1.1sd.s=sd(saledatacomplete.cases(saledata),$"销量")mn.s=mean(saledatacomplete.cases(saledata),$"

18、;销量")points(xi,mn.s,col="red",pch=18)arrows(xi,mn.s-sd.s,xi,mn.s+sd.s,code=3,col="pink",angle=75,length=.1)text(rep(c(1.05,1.05,0.95,0.95),length=length(sp$out),labels=sp$outorder(sp$out),sp$outorder(sp$out)+rep(c(150,-150,150,-150),length=length(sp$out),col="red")

19、实验结果:-卡调fl!工ft空旧I-setgdCF;/exl.J示SlffiR:-J,晓人第由asa-N-afjarja-r-fijad.匚注<""!"ig-.91./cJnHn/HmtrotrFrhg_占口7lo1口工工3、ffIF-iaa«dfirtirr_e>二*型去flS域源I井用干叫叫丁冠LIE和FAL5E牙利土作:工、口可以而J3UEE3和mmriEB.曲容封别师取和*样本妙,岫失kfcM-H.irr*fmrpplc.<"jits<55Csnlrscirtira>"t±JZOO'后ui”£K<ornple匚名。谷(国Al晶石。雷方>EXX>ivoan<rcoipploto.仁,口占£,口【odnE、,Ex3O.004mFf:LN4ar1ctHvplete.easea<seledeta>.J日心mriJL$iOAS/S/X-liZ向;*异*伯侬删扯迷阐匕sp-tno;p-|C

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论