深度学习技术与应用 课件 第12章 Keras 搭建模型预测信息_第1页
深度学习技术与应用 课件 第12章 Keras 搭建模型预测信息_第2页
深度学习技术与应用 课件 第12章 Keras 搭建模型预测信息_第3页
深度学习技术与应用 课件 第12章 Keras 搭建模型预测信息_第4页
深度学习技术与应用 课件 第12章 Keras 搭建模型预测信息_第5页
已阅读5页,还剩28页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

深度学习技术与应用DeepLearningTechnologyandApplicationcontents目录第十二章Keras搭建模型预测游客信息01.

DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmodelPART1DataFrame分析数据和数据预处理01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing项⽬构建

本章我们将利⽤Keras建⽴深度学习模型分析泰坦尼克号的每⼀位船员存活概率,新建⼀个新的ipynb⽂件,并且进⼊到⽂件中,初次使⽤该数据集需要使⽤以下代码下载titanic3.xls⽂件到dataset⽂件夹当中。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing数据预处理该数据集主要记录了泰坦尼克号所有游客的信息,主要信息包括如下表格所示:以上字段survival代表该对象是否得以⽣还,是我们主要的预测结果,也就是label,其余的特征均是特征字段。⽽survival在数据中,0表示未⽣还,1表示存活;pclass字段表示舱等,1、2、3分别可表示头等舱、⼆等舱和三等舱。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理使⽤Pandas提供的DataFrame功能和Numpy可读取xls⽂件,并格式化数据,可以更加⽅便的分析和处理数据。导⼊所需要的包:

importnumpy importpandasaspd %matplotlibinline importmatplotlib.pyplotasplt frommatplotlib.font_managerimportFontProperties font_zh=FontProperties(fname='./fz.ttf') all_df=pd.read_excel(filepath)

#使⽤Pandas提供的read_excel程序读取xls⽂件 all_df[:5]#查看读取到的all_df中的前5条数据01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理使⽤Pandas提供的DataFrame功能和Numpy可读取xls⽂件,并格式化数据,可以更加⽅便的分析和处理数据。查看读取到的all_df中的前5条数据01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理对数据进行简单分析,使用describe函数可以对已经建立好的数据进行变量统计,可以让人方便地看出各个变量之间存在相互影响的关系。all_df.describe()01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理对数据进行简单分析,使用describe函数可以对已经建立好的数据进行变量统计,可以让人方便地看出各个变量之间存在相互影响的关系。从数据结果来看,游客中平均⽣还0.38,其中游客平均年龄为29岁,也有上到80岁,下到4个⽉的游客。all_df.describe()01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理查看船上乘客的年龄和票价的整体分布情况。

01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

从图上可看出,船上的男性群体⽐⼥性群体来得多,但是男性获救的⽐例不到20%,⼥性获救的⽐例达到70%以上,说可能明船上的男⼠⽐较绅⼠,优先把存活的机会留给了⼥性。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

从上图可以发现不同等级的舱位⽣还概率不⼀样,其中头等舱⽣还概率是最⾼的,这说明在当时可能越有钱越容易被救。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

从S港⼝登录的⼈数最多,但是获救的⽐例却最低,C港⼝获救的⽐例是最⾼的,⼤概60%,Q港⼝为35%左右。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

对数据进行预处理,把需要⽤到的关键字选取到DataFrame中,忽略掉⼀些与预测结果⽆太多关系的数据,例如ticket(船票号码)和cabin(舱位号码)。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

为了⽅便机器学习,还需要对⼀些字段进⾏特殊处理。可以看到age字段存在较多的空值,因为后⾯建⽴深度学习模型传递的参数需要确⽴的数字,所以这⾥不允许使⽤空值,将年龄这个字段取整理平均值后填⼊空值的部分,其他字段例如fare以此类推,这样的做法相对⽐较合理,⽽不是直接填⼊0,或者随意数字,容易影响对真实结果的预测。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

利⽤mean函数计算年龄平均值后,使⽤fillna对空值字段进⾏填⼊。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤DataFrame分析数据和数据预处理

利⽤mean函数计算年龄平均值后,使⽤fillna对空值字段进⾏填⼊。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤Numpy进⾏数据预处理使⽤DataFrame处理好数据后,后续需要交由Numpy进⾏处理才可搭建深度学习模型进⾏训练预测。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing使⽤Numpy进⾏数据预处理使⽤DataFrame处理好数据后,后续需要交由Numpy进⾏处理才可搭建深度学习模型进⾏训练预测。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing特征字段进⾏标准化使⽤sklearn提供的preprocessing模块进⾏标准化的处理01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing建⽴和划分数据集将数据集以8:2的模式划分为训练集和测试集01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing建⽴和划分数据集将数据集以8:2的模式划分为训练集和测试集01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing建⽴和划分数据集创建DataPreprocessing函数,对之前数据处理⽅式做⼀个函数式的整合,⽅便下次调⽤。01.DataFrame分析数据和数据预处理Dataframeanalysisdataanddatapreprocessing建⽴和划分数据集使⽤DataPreprocessing函数建⽴训练和测试数据集。PART2采⽤多层感知机模型进⾏预测02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmodel模型建⽴利⽤keras建⽴多层感知机模型,模型⼀共包含⼀个输⼊层、两个隐藏层和⼀个输⼊层。units各层神经元的个数input_dim是出⼊层神经元的个数,9表示有9个特征字段kernel_initializer是使⽤随机数分布初始化权重和偏差activation表示激活函数,这边使⽤的都是relu和sigmoid02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmodel训练首先定义训练参数,x和y分别传入上一节建立的train_features和train_label数据集:VALIDATION_SPLIT为设置训练集和验证集数据的划分比例,输入参数0~1的浮点数,用来指定训练集的一定比例数据作为验证集。验证集将不参与训练,并在每个epoch结束后测试模型的指标,如损失函数、精确度等。EPOCHS为训练周期。BATCH_SIZE为单次训练批次。VERBOSE为显示训练的过程,输入参数(0、1、2),0为不在标准输出流输出日志信息,1为输出进度条记录,2为每个epoch输出一行记录。02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmodel训练02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmodel训练定义绘制函数,绘制出训练结果。使用绘制函数绘制出准确率与误差率图像。02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmodel模型评估利⽤训练好的模型使⽤测试集进⾏模型的评估,分数越⾼表示训练结果越好。02.采⽤多层感知机模型进⾏预测Predictionusingmulti-layerperceptronmode

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论