机器学习中有关概率论知识的小结_第1页
机器学习中有关概率论知识的小结_第2页
机器学习中有关概率论知识的小结_第3页
机器学习中有关概率论知识的小结_第4页
机器学习中有关概率论知识的小结_第5页
已阅读5页,还剩2页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、机器学习中有关概率论知识的小结、引言最近写了许多关于机器学习的学习笔记,里面经常涉及概率论的知识,这里对所有概率论知识做一个总结和复习,方便自己查阅,与广大博友共享,所谓磨刀不误砍柴工,希望博友们在这篇博文的帮助下,阅读机器学习的相关文献时能够更加得心应手!这里只对本人觉得经常用到的概率论知识点做一次小结,主要是基本概念,因为机器学习中涉及概率论的地方,往往知道基本概念就不难理解,后面会不定期更新,希望博友们多留言补充。二、贝叶斯(Bayes)公式通常把事件A的概率P(A)叫做实验前的假设概率,即先验概率(priorprobability),如果有另一个事件B与事件A有某种关系,即事件A和B不

2、是互相独立的,那么当事件B确实发生之后,则应当重新估计事件A的概率,即P(A|B),这叫做条件概率或者试验后的假设概率,即后验概率(posteriorprobability).公式一:再引入全概率公式:设事件A当前仅当互不相容的事件(即任意两个事件不可能同时发生的)5(i=1,2,).中的任意一个事件发生时才可能发生,已知事件Hi的概率卩(比)及事件A在乩已发生的条件下的条件概率,则事件A发生的概率为:ni=l这就是全概率公式.根据概率乘法定理:P(AB)=P(A)P(BA)二P(B)P(AR)我们可以得到:PP&訂(辭加|财P(民)玖4|艮)于是:再根据上面介绍的全概率公式,则可得到传说中的

3、贝叶斯公式巩5)吃|艮)这些公式定理几乎贯穿整个机器学习,很基本,也很重要!三、常用的离散随见变量分布i.“0T”分布:设随机变量X只能取得两个数值:0与1,而概率函数是:北二0,i;通常把这种分布叫做“0-1”分布或者两点分布,卩是分布参数2.二项分布(binomialdistribution):设随机变量X可能的的值是0,1,2,n,而概率函数是:其中0;和P,通常把这种分布记作R(弘卩)丄,这种分布叫做二项分布,含有两个参f(x)=Cpxqnx,如果随见变量x服从二项分布数乳召(徐卩),记作X3.泊松(Possion)分布:设随机变量X的可能值是一切非负整数,而概率函数是:其中九0为常数

4、,这种分布叫做泊松分布。泊松分布就含有一个参数九,记作P),如果随机变量X服从泊松分布,则记作XP四、随机变量的分布函数设x是任何实数,考虑随机变量X取得的值不大于x的概率,即事件Xx的概率,记作F(x)=P(Xx),这个函数叫做随机变量X的概率分布函数或者分布函数,注意区别于上面讲到的概率函数.如果已知随机变量X的分布函数F(X),则随见变量X落在半开区间,x2内的概率:P(xiXx2)=F(x2)-F(xi)五、连续随机变量的概率密度连续随机变量的概率密度就是分布函数的导函数六、随机变量的数学期望如果随机变量X只能取得有限个值:而取得有限个值得概率分别是:pCQ型(动卫仏)则数学期望:E(

5、X)=+x2p(x2)+n=Fxnpxn)如果连续随机变量x的概率密度为/(X),则连续随机变量的数学期望:xf(x)dx一个常数的的数学期望等于这个常数本身。定理:两个独立随机变量的乘积的数学期望等于它们数学期望的乘积。证明如下:对于离散随机变量X与Y独立:E(XY)=II可护。旳)iiij2_jXipx(xi)2_jyjpY(yjy=EQQEm对于连续随机变量X与Y独立:4-ooE(XY)=+ooy/r(y)妙oo4-coxyf(x,y)dxdy“一oooo+ooxyfxdxdy.co*cor+oo=Ixfx(尤)dxJoo=E(X)E(Yy七、方差与标准差随机变量X的方差记作D(X),定

6、义为:下面证明一个很有用的公式(会用到性质:一个常数的的数学期望等于这个常数本身):D(X)=EX_E(X)2”=EX2一2XE(X)+(X)2.=E(X2-2EXEX)+EE(X)2).=E(X2)一2E(X)E(X)+E(X)巴=E(XE(X)F简而言之:随机变量的方差等于变量平方的期望减去期望的平方.标准差就是方差的算术平方根。常数的方差为0.八、协方差与相关系数随机变量X与随机变量Y的协方差记作:进一步推导可得:因为两个独立随机变量乘积的期望等于两个随机变量各自期望的乘积,于是当两个随机变量独立使,很容易得到它们的协方差为0.两个随机变量X与Y的相关系数为:两个随机变量的相关系数的绝对值不大于1.当且仅当随机变量Y与X之间存在线性关系:时,相关系数R(X)的绝对值等于1,并且1bQ九、正态分布正态分布又叫高斯分布,设连续随机变量X的概率密度fW1盂_肛=-=e_272j-oox0都是常数,这种分布就是正态分布正态分布含有两个参数卩及00,其中U等于正态分布的数学期望,而o等于正态分布的N(ufcr2)N(u,cr2)标准差,通常把这种分布记作,随机

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论