




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
机器学习实战演讲人202x-11-1101版权声明版权声明02献词献词
03一分类一分类041机器学习基础1机器学习基础11.1何谓机器学习21.2关键术语31.3机器学习的主要任务41.4如何选择合适的算法51.5开发机器学习应用程序的步骤61.6python语言的优势1机器学习基础1.7numpy函数库基础1.8本章小结1.8本章小结1机器学习基础1.1何谓机器学习11.1.1传感器和海量数据21.1.2机器学习非常重要1机器学习基础1.6python语言的优势11.6.1可执行伪代码21.6.2python比较流行31.6.3python语言的特色41.6.4python语言的缺点052k-近邻算法2k-近邻算法2.1k-近邻算法概述2.2示例:使用k近邻算法改进约会网站的配对效果2.3示例:手写识别系统2.4本章小结2k-近邻算法2.1k-近邻算法概述12.1.1准备:使用python导入数据22.1.2实施knn分类算法32.1.3如何测试分类器2k-近邻算法2.2示例:使用k近邻算法改进约会网站的配对效果2.2.1准备数据:从文本文件中解析数据012.2.2分析数据:使用matplotlib创建散点图022.2.3准备数据:归一化数值032.2.4测试算法:作为完整程序验证分类器042.2.5使用算法:构建完整可用系统052k-近邻算法2.3示例:手写识别系统ab2.3.2测试算法:使用k近邻算法识别手写数字2.3.1准备数据:将图像转换为测试向量063决策树3决策树3.1决策树的构造3.2在python中使用matplotlib注解绘制树形图3.3测试和存储分类器3.4示例:使用决策树预测隐形眼镜类型3.5本章小结3.2在Python中使用Matplotlib注解绘制树形图3.3测试和存储分类器3.4示例:使用决策树预测隐形眼镜类型3.5本章小结3决策树3.1决策树的构造3.1.2划分数据集1323.1.1信息增益3.1.3递归构建决策树3决策树3.2在python中使用matplotlib注解绘制树形图a3.2.1matplotlib注解3.2.2构造注解树b3决策树3.3测试和存储分类器ab3.3.2使用算法:决策树的存储3.3.1测试算法:使用决策树执行分类074基于概率论的分类方法:朴素贝叶斯14.1基于贝叶斯决策理论的分类方法34.3使用条件概率来分类24.2条件概率44.4使用朴素贝叶斯进行文档分类4基于概率论的分类方法:朴素贝叶斯54.5使用Python进行文本分类64.6示例:使用朴素贝叶斯过滤垃圾邮件4基于概率论的分类方法:朴素贝叶斯4.7示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向4.8本章小结4基于概率论的分类方法:朴素贝叶斯4.5使用python进行文本分类4.5.1准备数据:从文本中构建词向量014.5.2训练算法:从词向量计算概率024.5.3测试算法:根据现实情况修改分类器034.5.4准备数据:文档词袋模型044基于概率论的分类方法:朴素贝叶斯4.6示例:使用朴素贝叶斯过滤垃圾邮件01024.6.1准备数据:切分文本4.6.2测试算法:使用朴素贝叶斯进行交叉验证4基于概率论的分类方法:朴素贝叶斯4.7示例:使用朴素贝叶斯分类器从个人广告中获取区域倾向14.7.1收集数据:导入rss源24.7.2分析数据:显示地域相关的用词085logistic回归5logistic回归5.1基于logistic回归和sigmoid函数的分类
5.2基于最优化方法的最佳回归系数确定5.2.1梯度上升法5.2.2训练算法:使用梯度上升找到最佳参数5.2.3分析数据:画出决策边界5.2.4训练算法:随机梯度上升5.3示例:从疝气病症预测病马的死亡率5.3.1准备数据:处理数据中的缺失值5.3.2测试算法:用logistic回归进行分类5.4本章小结
5.2基于最优化方法的最佳回归系数确定5.2.1梯度上升法5.2.2训练算法:使用梯度上升找到最佳参数5.2.3分析数据:画出决策边界5.2.4训练算法:随机梯度上升5.3示例:从疝气病症预测病马的死亡率5.3.1准备数据:处理数据中的缺失值5.3.2测试算法:用Logistic回归进行分类5.4本章小结
096支持向量机6支持向量机ABCDEF6.1基于最大间隔分隔数据6.3smo高效优化算法6.5在复杂数据上应用核函数6.2寻找最大间隔6.4利用完整plattsmo算法加速优化6.6示例:手写识别问题回顾6支持向量机6.7本章小结6支持向量机6.2寻找最大间隔16.2.1分类器求解的优化问题26.2.2svm应用的一般框架6支持向量机6.3smo高效优化算法ab6.3.2应用简化版smo算法处理小规模数据集6.3.1platt的smo算法6支持向量机6.5在复杂数据上应用核函数6.5.1利用核函数将数据映射到高维空间6.5.2径向基核函数6.5.3在测试中使用核函数107利用adaboost元算法提高分类性能17.1基于数据集多重抽样的分类器37.3基于单层决策树构建弱分类器27.2训练算法:基于错误提升分类器的性能47.4完整AdaBoost算法的实现7利用adaboost元算法提高分类性能57.5测试算法:基于AdaBoost的分类67.6示例:在一个难数据集上应用AdaBoost7利用adaboost元算法提高分类性能7.1基于数据集多重抽样的分类器017.1.1bagging:基于数据随机重抽样的分类器构建方法027.1.2boosting7利用adaboost元算法提高分类性能7.7非均衡分类问题单击此处添加标题9,300million7.7.1其他分类性能度量指标:正确率、召回率及roc曲线7.7.2基于代价函数的分类器决策控制7.7.3处理非均衡问题的数据抽样方法单击此处输入你的正文,文字是您思想的提炼,为了最终演示发布的良好效果,请尽量言简意赅的阐述观点;根据需要可酌情增减文字,以便观者可以准确理解您所传达的信息。11二利用回归预测数值型数据二利用回归预测数值型数据128预测数值型数据:回归8预测数值型数据:回归ABCDEF8.1用线性回归找到最佳拟合直线8.3示例:预测鲍鱼的年龄8.5权衡偏差与方差8.2局部加权线性回归8.4缩减系数来「理解」数据8.6示例:预测乐高玩具套装的价格8预测数值型数据:回归8.7本章小结8预测数值型数据:回归8.4缩减系数来「理解」数据8.4.1岭回归8.4.2lasso8.4.3前向逐步回归8预测数值型数据:回归8.6示例:预测乐高玩具套装的价格18.6.1收集数据:使用google购物的api28.6.2训练算法:建立模型139树回归9树回归19.1复杂数据的局部性建模29.2连续和离散型特征的树的构建39.3将cart算法用于回归49.4树剪枝59.5模型树69.6示例:树回归与标准回归的比较9.7使用python的tkinter库创建gui9.8本章小结9.8本章小结9树回归9树回归9.3将cart算法用于回归9.3.1构建树19.3.2运行代码29树回归9.4树剪枝9.4.1预剪枝19.4.2后剪枝29树回归9.7使用python的tkinter库创建gui19.7.1用tkinter创建gui29.7.2集成matplotlib和tkinter14三无监督学习三无监督学习1510利用k-均值聚类算法对未标注数据分组10利用k-均值聚类算法对未标注数据分组10.1k均值聚类算法
10.2使用后处理来提高聚类性能
10.3二分k均值算法
10.4示例:对地图上的点进行聚类10.4.1yahoo!placefinderapi10.4.2对地理坐标进行聚类10.4.2对地理坐标进行聚类10.5本章小结
1611使用apriori算法进行关联分析11使用apriori算法进行关联分析M.94275.CN111.1关联分析211.2apriori原理311.3使用apriori算法来发现频繁集411.4从频繁项集中挖掘关联规则511.5示例:发现国会投票中的模式611.6示例:发现毒蘑菇的相似特征11使用apriori算法进行关联分析11.7本章小结11使用apriori算法进行关联分析11.3使用apriori算法来发现频繁集111.3.1生成候选项集211.3.2组织完整的apriori算法11使用apriori算法进行关联分析11.5示例:发现国会投票中的模式11.5.1收集数据:构建美国国会投票记录的事务数据集11.5.2测试算法:基于美国国会投票记录挖掘关联规则1712使用fp-growth算法来高效发现频繁项集12使用fp-growth算法来高效发现频繁项集
12.1fp树:用于编码数据集的有效方式lorem12.2.1创建fp树的数据结构12.2.2构建fp树12.2.2构建FP树12.2构建fp树12.3.1抽取条件模式基12.3.2创建条件fp树12.3.2创建条件FP树12.3从一棵fp树中挖掘频繁项集
12.6本章小结
12.5示例:从新闻网站点击流中挖掘
12.4示例:在twitter源中发现一些共现词loremloremloremloremlorem18四其他工具四其他工具1913利用pca来简化数据
13.3示例:利用pca对半导体制造数据降维
13.4本章小结
13.1降维技术13.2.1移动坐标轴13.2.2在numpy中实现pca13.2.2在NumPy中实现PCA13.2pca单击此处添加文本具体内容,简明扼要的阐述您的观点。添加标题单击此处添加文本具体内容,简明扼要的阐述您的观点。添加标题66%36%13利用pca来简化数据2014利用svd简化数据14.1svd的应用14.2矩阵分解14.3利用python实现svd14.4基于协同过滤的推荐引擎14.5示例:餐馆菜肴推荐引擎14.6示例:基于svd的图像压缩14利用svd简化数据单击此处添加文本具体内容,简明扼要的阐述您的观点。根据需要可酌情增减文字,以便观者准确的理解您传达的思想。单击此处添加标题14利用svd简化数据14.7本章小结14.1svd的应用14.1.2推荐系统14利用svd简化数据14利用svd简化数据14.4基于协同过滤的推荐引擎14.4.1相似度计算0114.4.2基于物品的相似度还是基于用户的相似度?0214.4.3推荐引擎的评价0314利用svd简化数据14.5示例:餐馆菜肴推荐引擎114.5.1推荐未尝过的菜肴214.5.2利用svd提高推荐的效果314.5.3构建推荐引擎面临的挑战2115大数据与mapreduce115.1MapReduce:分布式计算的框架315.3在Amazon网络服务上运行Hadoop程序215.2Hadoop流415.4MapReduce上的机器学习15大数据与mapreduce515.5在Python中使用mrjob来自动化MapReduce615.6示例:分布式SVM的Pegasos算法15大数据与mapreduce15.7你真的需要mapreduce吗?15.8本章小结15.8本章小结15大数据与mapreduce15.2hadoop流ab15.2.2分布式计算均值和方差的reducer15.2.1分布式计算均值和方差的mapper15大数据与mapreduce15.3在amazon网络服务上运行hadoop程序115.3.1aws上的可用服务215.3.2开启amazon网络服务之旅315.3.3在emr上运行hadoop作业15大数据与mapreduce15.5在python中使用mrjob来自动化mapredu
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 四川省主要粮油作物重大病虫害防治常用药剂、施药情况记录表
- 高效备考:CPSM2024试题及答案
- 提升CPMM应试能力的试题及答案
- 供应链管理师应对竞争策略试题及答案
- 供应链管理师人际沟通能力试题及答案
- 2024年SCMP考试预测及试题答案
- 采购管理师市场分析试题及答案
- 保健急救知识培训课件
- 2024年注册安全工程师笔试实战试题及答案
- SCMP考试变化与试题答案应对
- 员工聘用合同聘用合同
- 八年级上册语文全品作业本电子版
- CATIA-零件实体设计模块Part-Desi课件
- 中考地理易错题
- 职称专家推荐意见表
- 文学作品与名著勾连阅读专题复习-中考语文二轮专题
- 认证咨询机构设立审批须知
- 部编版道德与法治六年级下册第三单元《多样文明 多彩生活》大单元作业设计
- 设备安装施工方案与调试方案
- GB/T 34938-2017平面型电磁屏蔽材料通用技术要求
- GB/T 31989-2015高压电力用户用电安全
评论
0/150
提交评论