下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
通俗地理解贝叶斯公式(定理)朴素贝叶斯(NaiveBayesianalgorithm)是有监督学习的一种分类算法,它基于“贝叶斯定理”实现,该原理的提出人是英国著名数学家托马斯·贝叶斯。贝叶斯定理是基于概率论和统计学的相关知识实现的,因此在正式学习“朴素贝叶斯算法”前,我们有必要先认识“贝叶斯定理”。贝叶斯定理贝叶斯定理的发明者
托马斯·贝叶斯
提出了一个很有意思的假设:“如果一个袋子中共有10个球,分别是黑球和白球,但是我们不知道它们之间的比例是怎么样的,现在,仅通过摸出的球的颜色,是否能判断出袋子里面黑白球的比例?”上述问题可能与我们高中时期所接受的的概率有所冲突,因为你所接触的概率问题可能是这样的:“一个袋子里面有10个球,其中4个黑球,6个白球,如果你随机抓取一个球,那么是黑球的概率是多少?”毫无疑问,答案是0.4。这个问题非常简单,因为我们事先知道了袋子里面黑球和白球的比例,所以很容易算出摸一个球的概率,但是在某些复杂情况下,我们无法得知“比例”,此时就引出了贝叶斯提出的问题。在统计学中有两个较大的分支:一个是“频率”,另一个便是“贝叶斯”,它们都有各自庞大的知识体系,而“贝叶斯”主要利用了“相关性”一词。下面以通俗易懂的方式描述一下“贝叶斯定理”:通常,事件A在事件B发生的条件下与事件B在事件A发生的条件下,它们两者的概率并不相同,但是它们两者之间存在一定的相关性,并具有以下公式(称之为“贝叶斯公式”):看到上述公式,你可能一头雾水,不过不必慌张,下面我们来了解一下“贝叶斯”公式。符号意义首先我们要了解上述公式中符号的意义:P(A)这是概率中最基本的符号,表示A出现的概率。比如在投掷骰子时,P(2)指的是骰子出现数字“2”的概率,这个概率是六分之一。P(B|A)是条件概率的符号,表示事件A
发生的条件下,事件B
发生的概率,条件概率是“贝叶斯公式”的关键所在,它也被称为“似然度”。P(A|B)是条件概率的符号,表示事件B
发生的条件下,事件A发生的概率,这个计算结果也被称为“后验概率”。有上述描述可知,贝叶斯公式可以预测事件发生的概率,两个本来相互独立的事件,发生了某种“相关性”,此时就可以通过“贝叶斯公式”实现预测。条件概率条件概率是“贝叶斯公式”的关键所在,那么如何理解条件概率呢?其实我们可以从“相关性”这一词语出发。举一个简单的例子,比如小明和小红是同班同学,他们各自准时回家的概率是P(小明回家)=1/2和P(小红回家)=1/2,但是假如小明和小红是好朋友,每天都会一起回家,那么P(小红回家|小明回家)=1(理想状态下)。上述示例就是条件概率的应用,小红和小明之间产生了某种关联性,本来俩个相互独立的事件,变得不再独立。但是还有一种情况,比如小亮每天准时到家P(小亮回家)=1/2,但是小亮喜欢独来独往,如果问P(小亮回家|小红回家)的概率是多少呢?你会发现这两者之间不存在“相关性”,小红是否到家,不会影响小亮的概率结果,因此小亮准时到家的概率仍然是1/2。贝叶斯公式的核心是“条件概率”,譬如P(B|A),就表示当A发生时,B发生的概率,如果P(B|A)的值越大,说明一旦发生了A,B就越可能发生。两者可能存在较高的相关性。先验概率在贝叶斯看来,世界并非静止不动的,而是动态和相对的,他希望利用已知经验来进行判断,那么如何用经验进行判断呢?这里就必须要提到“先验”和“后验”这两个词语。我们先讲解“先验”,其实“先验”就相当于“未卜先知”,在事情即将发生之前,做一个概率预判。比如从远处驶来了一辆车,是轿车的概率是45%,是货车的概率是35%,是大客车的概率是20%,在你没有看清之前基本靠猜,此时,我们把这个概率就叫做“先验概率”。后验概率在理解了“先验概率”的基础上,我们来研究一下什么是“后验概率?”我们知道每一个事物都有自己的特征,比如前面所说的轿车、货车、客车,它们都有着各自不同的特征,距离过远的时候,我们无法用肉眼分辨,而当距离达到一定范围内就可以根据各自的特征再次做出概率预判,这就是后验概率。比如轿车的速度相比于另外两者更快可以记做P(轿车|速度快)=55%,而客车体型可能更大,可以记做P(客车|体型大)=35%。如果用条件概率来表述P(体型大|客车)=35%,这种通过“车辆类别”推算出“类别特征”发生的的概率的方法叫作“似然度”。这里的似然就是“可能性”的意思。朴素+贝叶斯了解完上述概念,你可能对贝叶斯定理有了一个基本的认识,实际上贝叶斯定理就是求解后验概率的过程,而核心方法是通过似然度预测后验概率,通过不断提高似然度,自然也就达到了提高后验概率的目的。我们知道“朴素贝叶斯算法”由两个词语组成。朴素(native)是用来修饰“贝叶斯”这个名词的。按照中文的理解“朴素”意味着简单不奢华。朴素的英文是“native”,意味着“单纯天真”。朴素
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 通信工程制图 6-2课件:配置配电室平面图图层
- 2024年独家销售授权协议模板2篇
- 高产高糖糖料蔗基地建设项目可行性研究报告-糖料蔗种植技术不断突破助力增产提糖
- 共享农庄项目可行性研究报告-乡村旅游热度不断攀升消费需求日益旺盛
- 《金融学复习简答题》课件
- 2024-2025学年八年级机械运动讲义+练习(含答案)
- 模板及脚手架支撑体系工程施工设计方案2018年
- 航空医疗课件
- 《预防接种疫苗》课件
- 2024年融资配对服务合同3篇
- 万科样板房说辞
- 办公家具投标方案
- 第六章 1弯曲变形课件
- 《红色经典诗词》课件
- 先进生产(工作者)申-报-表
- 公司领导干部现实表现材料
- 2023-2024学年广东广州越秀区数学六年级第一学期期末学业质量监测试题含答案
- 糖尿病视网膜病变课件
- 工业产品质量安全风险管控清单
- 七年级数学上册专题5.9 期末真题重组培优卷(人教版)(原卷版)
- 吊篮隐患排查清单
评论
0/150
提交评论