版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、朴素贝叶斯算法,Naive Bayes,算法流程图,朴素贝叶斯算法原理,01,贝叶斯定理 朴素贝叶斯算法流程,02,购买电脑实例,03,朴素贝叶斯算法存在的问题及应用,04,Table of Contents,内容大纲,朴素贝叶斯算法原理,朴素贝叶斯算法是分类算法中的一种。朴素贝叶斯的思想基础是这样的:对于给定的待分类项 , 求解在此项出现的条件下各个类别 出现的概率,哪个 最大。就把此待分类项归于哪个类别。 通俗来说,就好比你在街上看到一个黑人,我问你你猜这个人哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下,我们会选择
2、条件概率最大的类别,这就是朴素贝叶斯的思想基础。,条件概率: 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为: 为了得出 ,我们不加证明的给出贝叶斯定理。,贝叶斯分类的基础贝叶斯定理,先验概率和后验概率,先验概率:由以往的数据分析得到的概率。 后验概率:得到信息之后再重新加以修正的概率。,朴素贝叶斯算法流程,1.设 为一个待分类项,而每个 为 的一个特征属性。且特征属性之间相互独立(此处是朴素贝叶斯的假设)。 2.设 为一个类别集合。 3.计算 。 4.如果 则 。,接下来,由于假设各个特征属性都是条件独立的,那么根据贝叶斯定理有如下推导,因为
3、分母对于所有类别为常数,因此将分子最大化即可。 即:,朴素贝叶斯分类例子,数据样本用属性age, income, student 和credit rating 描述。类别属性buys computer 具有两个不同值(即yes, no)。设 对应于类buys computer = “yes”,而 对应于类buys computer = “no”。 我们分类的未知样本为: X = (age = 30, income =medium, student = yes, credit _ rating = fair).,1.我们需要最大化P(X | )P( ),i = 1,2。 每个类的先验概率P( )
4、可以根据训练样本计算: P(buys_computer = yes) = 9/14 = 0.643 P(buys_computer = no) = 5/14 = 0.357,2.计算后验概率P(X | ), i = 1,2(假设属性独立),P(age = “30” | buys_computer = “yes”) =0.222 P(age = “30” | buys_computer = “no”) =0.600 P(income =“medium” |buys_computer =“yes”) =0.444 P(income = “medium” | buys_computer =“no”)
5、 = 0.400 P(student = “yes” | buys_computer =“ yes”) =0.667 P(student = “yes” | buys_computer =“no”) =0.200 P(credit_rating = “fair” |buys_computer = “yes”) = 0.667 P(credit_rating = “fair” |buys_computer = “no”) = 0.400 P(X | buys_computer = “yes”) = 0.2220.4440.6670.667 = 0.044 P(X | buys_computer
6、= “no”) = 0.6000.4000.2000.400 = 0.019,3. 对每个类 ,计算P(X | )P( ) P(X | buys_computer = “yes”) P(buys_computer = “yes”) = 0.0440.643 = 0.028 P(X | buys_computer = “no”) P(buys_computer = “no”) = 0.0190.357 = 0.007 因此,对于样本X,朴素贝叶斯分类预测buys_computer =” yes”。,朴素贝叶斯算法存在的问题及应用,朴素贝叶斯分类器(Naive Bayes Classifier,或 NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 二零二五版承包工地食堂餐厨垃圾处理合同模板3篇
- 2024蔬菜加工产品销售合作协议3篇
- 2024年股权转让合同标的及属性详细描述
- 2024年版物业托管服务协议版B版
- 二零二五版离婚协议书起草与审核合同2篇
- 2024版房屋赠与合同协议书大全
- 天津中德应用技术大学《教育技术与传播》2023-2024学年第一学期期末试卷
- 二零二五版家政服务+家庭健康促进合同3篇
- 太原幼儿师范高等专科学校《西医外科学医学免疫学与病原生物学》2023-2024学年第一学期期末试卷
- 二零二五年特殊用途变压器安装与性能测试合同2篇
- 对口升学《计算机应用基础》复习资料总汇(含答案)
- 《浸没式液冷冷却液选型要求》
- 迪士尼乐园总体规划
- 2024年江苏省苏州市中考数学试卷含答案
- 2024年世界职业院校技能大赛高职组“市政管线(道)数字化施工组”赛项考试题库
- 介绍蝴蝶兰课件
- 大学计算机基础(第2版) 课件 第1章 计算机概述
- 数字化年终述职报告
- 2024年职工普法教育宣讲培训课件
- 安保服务评分标准
- T-SDLPA 0001-2024 研究型病房建设和配置标准
评论
0/150
提交评论