




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
朴素贝叶斯算法NaiveBayes算法流程图朴素贝叶斯算法原理01贝叶斯定理朴素贝叶斯算法流程02购买电脑实例03朴素贝叶斯算法存在的问题及应用04TableofContents内容大纲朴素贝叶斯算法原理朴素贝叶斯算法是分类算法中的一种。朴素贝叶斯的思想基础是这样的:对于给定的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大。就把此待分类项归于哪个类别。通俗来说,就好比你在街上看到一个黑人,我问你你猜这个人哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下,我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。条件概率:表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为:为了得出,我们不加证明的给出贝叶斯定理。贝叶斯分类的基础——贝叶斯定理先验概率和后验概率先验概率:由以往的数据分析得到的概率。后验概率:得到信息之后再重新加以修正的概率。朴素贝叶斯算法流程1.设为一个待分类项,而每个为的一个特征属性。且特征属性之间相互独立(此处是朴素贝叶斯的假设)。2.设为一个类别集合。3.计算。4.如果则。接下来,由于假设各个特征属性都是条件独立的,那么根据贝叶斯定理有如下推导,因为分母对于所有类别为常数,因此将分子最大化即可。即:朴素贝叶斯分类例子RIDageincomestudentCreditratingClass:buyscomputer1<=30highnofairno2<=30highnoexcellentno331-40highnofairyes4>40mediumnofairyes5>40lowyesfairyes6>40lowyesexcellentno731-40lowyesexcellentyes8<=30mediumnofairno9<=30lowyesfairNo10>40mediumyesfairyes11<=30mediumyesexcellentyes1231-40mediumnoexcellentyes1331-40highyesfairyes14>40mediumnoexcellentno数据样本用属性age,income,student和creditrating描述。类别属性buyscomputer具有两个不同值(即{yes,no})。设
对应于类buyscomputer=“yes”,而对应于类buyscomputer=“no”。我们分类的未知样本为:X=(age="<=30",income="medium",student="yes",credit_rating="fair").1.我们需要最大化P(X|
)P(
),i=1,2。每个类的先验概率P(
)可以根据训练样本计算:P(buys_computer=yes)=9/14=0.643P(buys_computer=no)=5/14=0.3572.计算后验概率P(X|
),i=1,2(假设属性独立)P(age=“<30”
|buys_computer=“yes”)=0.222P(age=“<30”
|buys_computer=“no”)=0.600P(income=“medium”
|buys_computer=“yes”)=0.444P(income=“medium”
|buys_computer=“no”)=0.400P(student=“yes”
|buys_computer=“
yes”)=0.667P(student=“yes”|buys_computer=“no”)=0.200P(credit_rating=“fair”|buys_computer=“yes”)=0.667
P(credit_rating=“fair”|buys_computer=“no”)=0.400P(X|buys_computer=“yes”)=0.222×0.444×0.667×0.667=0.044P(X|buys_computer=“no”)=0.600×0.400×0.200×0.400=0.019
3.对每个类,计算P(X|
)P(
)
P(X|buys_computer=“yes”)P(buys_computer=“yes”)=0.044×0.643=0.028P(X|buys_computer=“no”)P(buys_computer=“no”)=0.019×0.357=0.007因此,对于样本X,朴素贝叶斯分类预测buys_computer=”
yes”。朴素贝叶斯算法存在的问题及应用朴素贝叶斯分类器(NaiveBayesClassifier,或NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025年广东农工商职业技术学院高职单招(数学)历年真题考点含答案解析
- 2025年常州工业职业技术学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 2025年天津滨海职业学院高职单招语文2019-2024历年真题考点试卷含答案解析
- 2025年天津海运职业学院高职单招职业技能测试近5年常考版参考题库含答案解析
- 肺炎护理诊断
- 新发展英语(第二版)综合教程3 课件 Unit 6 Telecommunication
- 恋尚生活 旅 行
- 人教版数学六年级下册第六章复习(同步练习)
- 人教版数学六年级下册第一、二单元负数、百分数(二)
- 湖南电子科技职业学院《生物化学(B)》2023-2024学年第二学期期末试卷
- 2024年全国中学生天文知识竞赛考试题库(含答案)
- 会阴穴的穴位刺激对疾病的影响
- 《自然教育》课件-自然游戏
- 部编版语文一年级下册第六单元大单元教学任务群设计
- 脊柱侧弯矫正的七大门派
- DZ/T 0430-2023 固体矿产资源储量核实报告编写规范(正式版)
- 全民国家安全教育日知识测试题库和答案
- 廉洁教育班会.省公开课一等奖全国示范课微课金奖课件
- 2024版医疗器械行业数字化转型白皮书
- 12 清贫公开课一等奖创新教案
- 第四讲:简单长管的水力计算
评论
0/150
提交评论