




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、朴素贝叶斯算法,Naive Bayes,算法流程图,朴素贝叶斯算法原理,01,贝叶斯定理 朴素贝叶斯算法流程,02,购买电脑实例,03,朴素贝叶斯算法存在的问题及应用,04,Table of Contents,内容大纲,朴素贝叶斯算法原理,朴素贝叶斯算法是分类算法中的一种。朴素贝叶斯的思想基础是这样的:对于给定的待分类项 , 求解在此项出现的条件下各个类别 出现的概率,哪个 最大。就把此待分类项归于哪个类别。 通俗来说,就好比你在街上看到一个黑人,我问你你猜这个人哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下,我们会选择
2、条件概率最大的类别,这就是朴素贝叶斯的思想基础。,条件概率: 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为: 为了得出 ,我们不加证明的给出贝叶斯定理。,贝叶斯分类的基础贝叶斯定理,先验概率和后验概率,先验概率:由以往的数据分析得到的概率。 后验概率:得到信息之后再重新加以修正的概率。,朴素贝叶斯算法流程,1.设 为一个待分类项,而每个 为 的一个特征属性。且特征属性之间相互独立(此处是朴素贝叶斯的假设)。 2.设 为一个类别集合。 3.计算 。 4.如果 则 。,接下来,由于假设各个特征属性都是条件独立的,那么根据贝叶斯定理有如下推导,因为
3、分母对于所有类别为常数,因此将分子最大化即可。 即:,朴素贝叶斯分类例子,数据样本用属性age, income, student 和credit rating 描述。类别属性buys computer 具有两个不同值(即yes, no)。设 对应于类buys computer = “yes”,而 对应于类buys computer = “no”。 我们分类的未知样本为: X = (age = 30, income =medium, student = yes, credit _ rating = fair).,1.我们需要最大化P(X | )P( ),i = 1,2。 每个类的先验概率P( )
4、可以根据训练样本计算: P(buys_computer = yes) = 9/14 = 0.643 P(buys_computer = no) = 5/14 = 0.357,2.计算后验概率P(X | ), i = 1,2(假设属性独立),P(age = “30” | buys_computer = “yes”) =0.222 P(age = “30” | buys_computer = “no”) =0.600 P(income =“medium” |buys_computer =“yes”) =0.444 P(income = “medium” | buys_computer =“no”)
5、 = 0.400 P(student = “yes” | buys_computer =“ yes”) =0.667 P(student = “yes” | buys_computer =“no”) =0.200 P(credit_rating = “fair” |buys_computer = “yes”) = 0.667 P(credit_rating = “fair” |buys_computer = “no”) = 0.400 P(X | buys_computer = “yes”) = 0.2220.4440.6670.667 = 0.044 P(X | buys_computer
6、= “no”) = 0.6000.4000.2000.400 = 0.019,3. 对每个类 ,计算P(X | )P( ) P(X | buys_computer = “yes”) P(buys_computer = “yes”) = 0.0440.643 = 0.028 P(X | buys_computer = “no”) P(buys_computer = “no”) = 0.0190.357 = 0.007 因此,对于样本X,朴素贝叶斯分类预测buys_computer =” yes”。,朴素贝叶斯算法存在的问题及应用,朴素贝叶斯分类器(Naive Bayes Classifier,或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 民俗文化电子杂志行业深度调研及发展战略咨询报告
- 电力工程审计行业跨境出海战略研究报告
- 品牌与市场分析的跨学科研究
- 年处理废旧轮胎项目可行性研究报告模板-备案拿地
- 企业形象策划及品牌传播
- 全民健身背景下群众篮球赛事组织与管理创新研究
- 数字化技术助力企业内训升级
- 先学后教教学模式的创新与实践
- 至学小学数学期中考试质量分析与教学改进
- 制作与产品设计的一致性原则
- 健康咨询与服务推广协议
- 护士N1晋级N2述职报告
- 中国糖尿病防治指南(2024版)解读
- 食堂食材配送采购投标方案(技术标)
- 山东省汶上县市级名校2025届中考生物全真模拟试卷含解析
- 2025年度智能硬件产品全国区域独家代理合同3篇
- 办公室安全知识培训课件
- 2025年四川省成都市青白江区招聘50人历年高频重点提升(共500题)附带答案详解
- 2025年浙江嘉兴市众业供电服务限公司招聘38人高频重点提升(共500题)附带答案详解
- 中国技能大赛-第45届世界技能大赛全国选拔赛“水处理技术”项目技术工作文件
- 【课件】第12课+理想与典范-古希腊与古罗马美术+课件高中美术人教版(2019)美术鉴赏
评论
0/150
提交评论