下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、【原创】R语言报告论文(附代码数据)有问题到淘宝找“大数据部落”就可以了R语言HousePrice预测房价分析报告在这个分析中,我们将尝试预测房子的交易价格。因为有这么多变量,一些收缩回归可能是很好的选择以下是分析过程DataOverview数据概述加载要求的包library(dplyr)# #Attachingpackage:'dplyr'# #Thefollowingobjectsaremaskedfrom'package:stats':# # #filter,lag# #Thefollowingobjectsaremaskedfrom'packag
2、e:base':# # #intersect,setdiff,setequal,unionlibrary(ggplot2)library(mice)library(e1071)library(caret)# #Loadingrequiredpackage:latticelibrary(glmnet)# #Loadingrequiredpackage:Matrix# #Loadingrequiredpackage:foreach# #Loadedglmnet2.0-13library(xgboost)【原创】R语言报告论文(附代码数据)有问题到淘宝找“大数据部落”就可以了# #Attac
3、hingpackage:'xgboost'# #Thefollowingobjectismaskedfrom'package:dplyr':# #sliceImportthedataandcreateacombineddataset.Browsethedatasort(names(full)str(full)nacol=which(colSums(is.na(full)>0)sort(colSums(sapply(fullnacol,is.na),decreasing=T)# #PoolQCMiscFeatureAlleyFenceFireplaceQu#
4、 #29092814272123481420# #LotFrontageGarageYrBltGarageFinishGarageQualGarageCond# #486159159159159# #GarageTypeBsmtCondBsmtExposureBsmtQualBsmtFinType2# #BsmtFinType1MasVnrTypeMasVnrAreaMSZoningUtilities# #79242342# #BsmtFullBathBsmtHalfBathFunctionalExterior1stExterior2nd# #22211# #Bsm
5、tFinSF1BsmtFinSF2BsmtUnfSFTotalBsmtSFElectrical# #11111【原创】R语言报告论文(附代码数据)有问题到淘宝找“大数据部落”就可以了# #KitchenQualGarageCarsGarageAreaSaleType# #1111【原创】R语言报告论文(附代码数据)有问题到淘宝找“大数据部落”就可以了BIEoca若fl言山Is,Mr力£菖击n里总tflst<zMMdzM归一生54MNEEffi003,目需口-¥c器>WE名J名E-l品£盘6甘用N-Hep匚nreoirder(NeighbortKjQd,
6、-Price3营*05AmountGaraqeYrBItMissingValue缺失值【原创】R语言报告论文(附代码数据)有问题到淘宝找“大数据部落”就可以了PoolQCPoolQC中缺少2909个。我们推断的原因是大多数家庭没有泳池。所以我们将看到是否有任何PoolArea不是0与NA池QC然后我们根据PoolArea填充三个PoolQC,另一个填充没有。poolna=which(is.na(full$PoolQC)full(full$PoolArea)>0&is.na(full$PoolQC),c("PoolArea","PoolQC"
7、)# #PoolAreaPoolQC# #2421368<NA># #2504444<NA># #2600561<NA>full%>%elect(PoolArea,PoolQC)%>%group_by(PoolQC)%>%summarise(mean=mean(PoolArea),count=n()# #Atibble:4x3# #PoolQCmeancount# #<chr><dbl><int># #1Ex359.75000004# #2Fa583.50000002# #3Gd648.50000004#
8、 #4<NA>0.47198352909full$PoolQCc(2421,2504)="Ex"full$PoolQC2600="Fa"full$PoolQCis.na(full$PoolQC)="None"MiscFeature当我们谈论MiscFeature时,只有一个MiscVal>0与NAMiscFeature。通过MiscVal对数据进行排序,我们发现最广泛的MiscVal来自第二个车库。所以我们用“Gar2”填写了丢失的MiscFeature。misna=which(is.na(full$MiscFeature)fullfull$MiscVal>0&is.na(full$MiscFeature),c("MiscFeature","MiscVa
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 网络安全投资管理
- 环保科技产品贷款保证措施
- 展览馆高端格力空调投标资料
- 旅游公司导游聘任合同
- 纺织类专业职业生涯规划
- 汽车美容店店长聘任范本
- 2024年食品原料采购协议2篇
- 污水处理厂扩建大包工程施工合同
- 武汉市地下水保护与新材料研发
- 宫颈出血的临床护理
- 初中难度几何100题
- 消防维保公司管理制度消防维保管理制度范本.doc
- 经尿道前列腺电切术的手术护理-经尿道前列腺电切术护理问题
- 防爆柜使用说明书课件
- 轴承压装力计算软件
- 家庭装修预算模板
- 信用卡中心司法催收律师事务所服务方案
- 校长在上级领导检查指导工作会议上的汇报发言
- GK1C常用配件
- 上海市住宅物业服务分等收费标准[附详细表]-一、综合管理
- 国有企业人才培训实施方案
评论
0/150
提交评论