版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
朴素贝叶斯算法NaiveBayes算法流程图朴素贝叶斯算法原理01贝叶斯定理朴素贝叶斯算法流程02购买电脑实例03朴素贝叶斯算法存在的问题及应用04TableofContents内容大纲朴素贝叶斯算法原理朴素贝叶斯算法是分类算法中的一种。朴素贝叶斯的思想基础是这样的:对于给定的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大。就把此待分类项归于哪个类别。通俗来说,就好比你在街上看到一个黑人,我问你你猜这个人哪里来的,你十有八九猜非洲。为什么呢?因为黑人中非洲人的比率最高,当然人家也可能是美洲人或亚洲人,但在没有其它可用信息下,我们会选择条件概率最大的类别,这就是朴素贝叶斯的思想基础。条件概率:表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为:为了得出,我们不加证明的给出贝叶斯定理。贝叶斯分类的基础——贝叶斯定理先验概率和后验概率先验概率:由以往的数据分析得到的概率。后验概率:得到信息之后再重新加以修正的概率。朴素贝叶斯算法流程1.设为一个待分类项,而每个为的一个特征属性。且特征属性之间相互独立(此处是朴素贝叶斯的假设)。2.设为一个类别集合。3.计算。4.如果则。接下来,由于假设各个特征属性都是条件独立的,那么根据贝叶斯定理有如下推导,因为分母对于所有类别为常数,因此将分子最大化即可。即:朴素贝叶斯分类例子RIDageincomestudentCreditratingClass:buyscomputer1<=30highnofairno2<=30highnoexcellentno331-40highnofairyes4>40mediumnofairyes5>40lowyesfairyes6>40lowyesexcellentno731-40lowyesexcellentyes8<=30mediumnofairno9<=30lowyesfairNo10>40mediumyesfairyes11<=30mediumyesexcellentyes1231-40mediumnoexcellentyes1331-40highyesfairyes14>40mediumnoexcellentno数据样本用属性age,income,student和creditrating描述。类别属性buyscomputer具有两个不同值(即{yes,no})。设
对应于类buyscomputer=“yes”,而对应于类buyscomputer=“no”。我们分类的未知样本为:X=(age="<=30",income="medium",student="yes",credit_rating="fair").1.我们需要最大化P(X|
)P(
),i=1,2。每个类的先验概率P(
)可以根据训练样本计算:P(buys_computer=yes)=9/14=0.643P(buys_computer=no)=5/14=0.3572.计算后验概率P(X|
),i=1,2(假设属性独立)P(age=“<30”
|buys_computer=“yes”)=0.222P(age=“<30”
|buys_computer=“no”)=0.600P(income=“medium”
|buys_computer=“yes”)=0.444P(income=“medium”
|buys_computer=“no”)=0.400P(student=“yes”
|buys_computer=“
yes”)=0.667P(student=“yes”|buys_computer=“no”)=0.200P(credit_rating=“fair”|buys_computer=“yes”)=0.667
P(credit_rating=“fair”|buys_computer=“no”)=0.400P(X|buys_computer=“yes”)=0.222×0.444×0.667×0.667=0.044P(X|buys_computer=“no”)=0.600×0.400×0.200×0.400=0.019
3.对每个类,计算P(X|
)P(
)
P(X|buys_computer=“yes”)P(buys_computer=“yes”)=0.044×0.643=0.028P(X|buys_computer=“no”)P(buys_computer=“no”)=0.019×0.357=0.007因此,对于样本X,朴素贝叶斯分类预测buys_computer=”
yes”。朴素贝叶斯算法存在的问题及应用朴素贝叶斯分类器(NaiveBayesClassifier,或NBC)发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024年区块链应用开发与合作合同
- 2024年度医疗机构水电安装工程专业分包合同2篇
- 《国际海上保险合同法律适用问题的研究》
- 2024版工业园物业公司车辆通行管理合同
- 2024年度股权转让合同详细条款及实施规则2篇
- 2024年度许可使用合同:知名商标许可使用协议2篇
- 2024版新材料研发合同书2篇
- 2024新版工地施工合同样式
- 2024版国际房地产买卖合同3篇
- 2024年度影视制作合同标的为一部电影拍摄制作2篇
- 社会主义核心价值观主题班会-4-主题班会课件
- 路缘石安砌作业指导书
- 《预防血管内导管相关血流感染过程质控工具包》解读
- 软件正版化培训课件
- 第3章 CR400BF动车组司机室《复兴号动车组司机操作及整备》教学课件
- GIS组合电器结构动作原理课件
- 浦江县国企招聘考试真题及答案
- 小学语文新课标(2022版)考试复习题库(汇总)
- 国开市场营销策划(本)课程形考1-4试题及答案
- 四年级英语上册教材分析(PEP人教版)
- 2023医院反恐防暴应急演练脚本
评论
0/150
提交评论