Python机器学习手册:从数据预处理到深度学习_第1页
Python机器学习手册:从数据预处理到深度学习_第2页
Python机器学习手册:从数据预处理到深度学习_第3页
Python机器学习手册:从数据预处理到深度学习_第4页
Python机器学习手册:从数据预处理到深度学习_第5页
已阅读5页,还剩59页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

Python机器学习手册:从数据预处理到深度学习读书笔记模板01思维导图目录分析读书笔记内容摘要作者介绍精彩摘录目录0305020406思维导图数据机器机器书学习代码任务读者特征数据第章值简介处理模型分类器评估训练可视化本书关键字分析思维导图内容摘要内容摘要这是一本关于Python的图书,采用基于任务的方式来介绍如何在机器学习中使用Python。书中有近200个独立的解决方案(并提供了相关代码,读者可以复制并粘贴这些代码,用在自己的程序中),针对的都是数据科学家或机器学习工程师在构建模型时可能遇到的最常见任务,涵盖最简单的矩阵和向量运算到特征工程以及神经网络的构建。本书不是机器学习的入门书,适合熟悉机器学习的理论和概念的读者摆在案头作为参考,他们可以借鉴书中的代码,快速解决在机器学习的日常开发中遇到的挑战。目录分析1.0简介1.1创建一个向量1.2创建一个矩阵1.3创建一个稀疏矩阵第1章向量、矩阵和数组1.4选择元素1.5展示一个矩阵的属性1.6对多个元素同时应用某个操作1.7找到最大值和最小值1.8计算平均值、方差和标准差12345第1章向量、矩阵和数组1.9矩阵变形1.10转置向量或矩阵1.11展开一个矩阵1.12计算矩阵的秩1.13计算行列式12345第1章向量、矩阵和数组1.14获取矩阵的对角线元素1.15计算矩阵的迹1.16计算特征值和特征向量1.17计算点积1.18矩阵的相加或相减1.19矩阵的乘法010302040506第1章向量、矩阵和数组1.21生成随机数1.20计算矩阵的逆第1章向量、矩阵和数组2.0简介2.1加载样本数据集2.2创建仿真数据集2.3加载CSV文件第2章加载数据2.4加载Excel文件2.6查询SQL数据库2.5加载JSON文件第2章加载数据3.0简介3.1创建一个数据帧3.2描述数据3.3浏览数据帧3.4根据条件语句来选择行3.5替换值010302040506第3章数据整理3.6重命名列3.7计算最小值、最大值、总和、平均值与计数值3.8查找唯一值3.9处理缺失值3.10删除一列3.11删除一行010302040506第3章数据整理3.12删除重复行3.13根据值对行分组3.14按时间段对行分组3.15遍历一个列的数据第3章数据整理3.16对一列的所有元素应用某个函数3.17对所有分组应用一个函数3.18连接多个数据帧3.19合并两个数据帧第3章数据整理4.0简介4.1特征的缩放4.2特征的标准化4.3归一化观察值4.4生成多项式和交互特征12345第4章处理数值型数据4.5转换特征4.6识别异常值4.7处理异常值4.8将特征离散化第4章处理数值型数据4.9使用聚类的方式将观察值分组4.11填充缺失值4.10删除带有缺失值的观察值第4章处理数值型数据5.0简介5.1对nominal型分类特征编码5.2对ordinal分类特征编码5.3对特征字典编码第5章处理分类数据5.5处理不均衡分类5.4填充缺失的分类值第5章处理分类数据6.0简介6.1清洗文本6.2解析并清洗HTML6.3移除标点6.4文本分词12345第6章处理文本6.5删除停止词(stopword)6.6提取词干6.7标注词性6.8将文本编码成词袋(BagofWords)6.9按单词的重要性加权12345第6章处理文本7.0简介7.2处理时区7.1把字符串转换成日期第7章处理日期和时间7.3选择日期和时间7.4将日期数据切分成多个特征7.5计算两个日期之间的时间差7.6对一周内的各天进行编码7.7创建一个滞后的特征12345第7章处理日期和时间7.9处理时间序列中的缺失值7.8使用滚动时间窗口第7章处理日期和时间8.0简介8.1加载图像8.2保存图像8.3调整图像大小8.4裁剪图像8.5平滑处理图像010302040506第8章图像处理8.6图像锐化8.7提升对比度8.8颜色分离8.9图像二值化第8章图像处理8.10移除背景8.11边缘检测8.12角点检测8.13为机器学习创建特征8.14将颜色平均值编码成特征8.15将色彩直方图编码成特征010302040506第8章图像处理9.0简介9.1使用主成分进行特征降维9.2对线性不可分数据进行特征降维9.3通过最大化类间可分性进行特征降维第9章利用特征提取进行特征降维9.5对稀疏数据进行特征降维9.4使用矩阵分解法进行特征降维第9章利用特征提取进行特征降维10.0简介10.1数值型特征方差的阈值化10.2二值特征的方差阈值化10.3处理高度相关性的特征第10章使用特征选择进行降维10.5递归式特征消除10.4删除与分类任务不相关的特征第10章使用特征选择进行降维11.0简介11.1交叉验证模型11.2创建一个基准回归模型11.3创建一个基准分类模型第11章模型评估11.4评估二元分类器11.5评估二元分类器的阈值11.6评估多元分类器11.7分类器性能的可视化11.8评估回归模型11.9评估聚类模型010302040506第11章模型评估11.10创建自定义评估指标11.11可视化训练集规模的影响11.12生成对评估指标的报告11.13可视化超参数值的效果第11章模型评估12.0简介12.1使用穷举搜索选择最佳模型12.2使用随机搜索选择最佳模型12.3从多种学习算法中选择最佳模型12.4将数据预处理加入模型选择过程12345第12章模型选择12.5用并行化加速模型选择12.7模型选择后的性能评估12.6使用针对特定算法的方法加速模型选择第12章模型选择13.0简介13.1拟合一条直线13.2处理特征之间的影响13.3拟合非线性关系第13章线性回归13.5使用套索回归减少特征13.4通过正则化减少方差第13章线性回归14.0简介14.1训练决策树分类器14.2训练决策树回归模型14.3可视化决策树模型14.4训练随机森林分类器14.5训练随机森林回归模型010302040506第14章树和森林14.6识别随机森林中的重要特征14.7选择随机森林中的重要特征14.8处理不均衡的分类14.9控制决策树的规模14.10通过boosting提高性能14.11使用袋外误差(Out-of-BagError)评估随机森林模型010302040506第14章树和森林15.0简介15.2创建一个KNN分类器15.1找到一个观察值的最近邻第15章KNN15.4创建一个基于半径的最近邻分类器15.3确定最佳的邻域点集的大小第15章KNN16.0简介16.1训练二元分类器16.2训练多元分类器16.3通过正则化来减小方差16.4在超大数据集上训练分类器16.5处理不均衡的分类010302040506第16章逻辑回归17.0简介17.1训练一个线性分类器17.2使用核函数处理线性不可分的数据17.3计算预测分类的概率第17章支持向量机17.5处理不均衡的分类17.4识别支持向量第17章支持向量机18.0简介18.1为连续的数据训练分类器18.2为离散数据和计数数据训练分类器18.3为具有二元特征的数据训练朴素贝叶斯分类器18.4校准预测概率12345第18章朴素贝叶斯19.0简介19.1使用K-Means聚类算法19.2加速K-Means聚类19.3使用Meanshift聚类算法第19章聚类19.5使用层次合并聚类算法19.4使用DBSCAN聚类算法第19章聚类20.0简介20.1为神经网络预处理数据20.2设计一个神经网络20.3训练一个二元分类器20.4训练一个多元分类器12345第20章神经网络20.5训练一个回归模型20.6做预测20.7可视化训练历史20.8通过权重调节减少过拟合第20章神经网络20.9通过提前结束减少过拟合20.11保存模型训练过程20.10通过Dropout减少过拟合第20章神经网络20.12使用k折交叉验证评估神经网络20.13调校神经网络20.14可视化神经网络20.15图像分类20.16通过图像增强来改善卷积神经网络的性能20.17文本分类010302040506第20章神经网络21.0简介21.2保存和加载Keras模型21.1保存和加载scikit-learn模型第

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论