版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、统计决策一、统计决策的三个要素1样本空间和分布族设总体X的分布函数为F(x;
),是未知参数,若设X1
,…,Xn是来自总体X的一个样本,则样本所有可能值组成的集合称为样本空间,记为X
2决策空间(判决空间)对于任何参数估计,每一个具体的估计值,就是一个回答,称为一个决策,一个统计问题中可能选取的全部决策组成的集合称为决策空间,一个决策空间至少应有两个决策。3损失函数统计决策的一个基本假定是,每采取一个决策,必然有一定的后果,统计决策是将不同决策以数量的形式表示出来常见的损失函数有以下几种(1)线性损失函数绝对损失函数(2)平方损失函数(3)凸损失函数(4)多元二次损失函数二、统计决策函数及风险函数1统计决策函数定义3.1:定义在样本空间上X,取值于决策空间A内的函数d(x),称为统计决策函数,简称决策函数决策函数就是一个行动方案,如果用表达式处理,d(x)=d(x1,x2,…xn)本质上就是一个统计量
2风险函数决策函数d(X),完全取决于样本,损失函数L(,d)也是样本X的函数,当样本取不同的值x时,决策d(X)可能不同,所以损失函数值L(,d)也不同,不能判断决策的好坏,一般从总体上来评价、比较决策函数,取平均损失,就是风险函数定义3.2设样本空间,分布族分别为X,F*,决策空间为A,损失函数为L(,d),d(X)为决策函数,为决策函数d(X)的风险函数,R(,d),表示采取决策d(X)所蒙受的平均损失(L(,d)的数学期望)
优良性准则定义3.3设d1,d2是统计问题中的两个决策函数,若其风险函数满足不等式则称决策函数d1优于d2定义3.4设D={d(X)}是一切定义在样本空间X上,取值于决策空间A上的决策函数全体,若存在一个决策函数d*(X),使对任意一个d(X)都有则称d*(X)为一致最小风险决策函数,或一致最优决策函数问题总结1风险函数是二元函数,极值往往不存在或不唯一2在某个区间内的逐点比较不现实(麻烦)3对应不同参数的,同一决策函数,风险值不相等4由统计规律的特性决定不能点点比较5必须由一个整体指标来代替点点比较2.贝叶斯估计
1)统计推断的基础
经典学派的观点:统计推断是根据样本信息对总体分布或总体的特征数进行推断,这里用到两种信息:总体信息和样本信息;贝叶斯学派的观点:除了上述两种信息以外,统计推断还应该使用第三种信息:先验信息。
(1)总体信息:总体分布提供的信息。(2)样本信息:抽取样本所得观测值提供的信息。(3)先验信息:人们在试验之前对要做的问题在经验上和资料上总是有所了解的,这些信息对统计推断是有益的。先验信息即是抽样(试验)之前有关统计问题的一些信息。一般说来,先验信息来源于经验和历史资料。先验信息在日常生活和工作中是很重要的。基于上述三种信息进行统计推断的统计学称为贝叶斯统计学。它与经典统计学的差别就在于是否利用先验信息。贝叶斯统计在重视使用总体信息和样本信息的同时,还注意先验信息的收集、挖掘和加工,使它数量化,形成先验分布,参加到统计推断中来,以提高统计推断的质量。忽视先验信息的利用,有时是一种浪费,有时还会导出不合理的结论。
贝叶斯学派的基本观点:任一未知量
都可看作随机变量,可用一个概率分布去描述,这个分布称为先验分布;在获得样本之后,总体分布、样本与先验分布通过贝叶斯公式结合起来得到一个关于未知量新的分布—后验分布;任何关于的统计推断都应该基于的后验分布进行。2)先验分布利用先验信息的前提(1)参数是随机的,但有一定的分布规律(2)参数是某一常数,但无法知道目标:充分利用参数的先验信息对未知参数作出更准确的估计。贝叶斯方法就是把未知参数视为具有已知分布的随机变量,将先验信息数字化并利用的一种方法,一般先验分布记为(
)3)贝叶斯公式的密度函数形式(后验分布)
设总体X的分布密度函数P(x;)在贝叶斯统计中记为P(x|),它表示在随机变量θ取某个给定值时总体的条件概率密度函数;P(x;)=P(x|)
根据参数的先验信息确定先验分布(
);
样本x1,x2
,
…,xn的联合条件分布密度函数为这个分布综合了总体信息和样本信息;0
是未知的,它是按先验分布(
)产生的。为把先验信息综合进去,不能只考虑0,对的其它值发生的可能性也要加以考虑,故要用()进行综合。这样一来,样本x1
,
…,xn和参数的联合分布为:f(x1,x2
,
…,xn,
)=q(x1,x2
,
…,xn)(
),
简记为f(x,
)=q(x)(
)
这个联合分布把总体信息、样本信息和先验信息三种可用信息都综合进去了;在有了样本观察值x1,x2
,
…,xn之后,则应依据f(x,
)对作出推断。由于f(x,
)=h(
x1,x2
,…,xn)m(x1,x2
,…,xn),其中m(x1,x2
,…,xn)是x1,x2
,
…,xn的边际概率函数,它与无关。因此能用来对作出推断的仅是条件分布h(
x1,x2
,
…,xn),它的计算公式是这个条件分布称为
的后验分布,它集中了总体、样本和先验中有关
的一切信息。
后验分布h(x1,x2
,
…,xn)的计算公式就是用密度函数表示的贝叶斯公式。它是用总体和样本对先验分布(
)作调整的结果,贝叶斯统计的一切推断都基于后验分布进行。
4)共轭先验分布定义:设总体X的分布密度为p(x|),F*为的一个分布族,()为
的任意一个先验分布,()∈F*,若对样本的任意观测值x,的后验分布h(|x)仍在F*内,称F*为关于分布密度p(x|)的共轭先验分布族,简称共轭族。计算共轭先验分布的方法
当给定样本的分布(似然函数)q(x|)
和先验分布(
);由贝叶斯公式得h(x|
)=(
)
q(
x
)/m(x)由于m(x)不依赖于,改写为h(x|
)∝(
)
q(
x
)上式不是正常的密度函数,是h(x|
)的主要部分,称为h(x|
)的核例8X1,X2
,
…,Xn来自正态分布N(
,2)的一个样本,其中已知,求方差2的共轭先验分布例9X1,X2
,
…,Xn来自二项分布B(N
,
)的一个样本,求的共轭先验分布计算共轭先验分布的方法1.h(|x)=()q(x|)/m(x),m(x)不依赖于
先求出q(x|),再选取与q(x|)具有相同形式的分布作为先验分布,就是共轭分布2.当参数存在适当的统计量时,设X的分布密度为p(x|),T(X)是的充分统计量,
再由定理3.1,求得共轭先验分布族定理3.1设f(
)为任一固定的函数,满足
若后验分布h(
x)与(
)属于同一个分布族,则称该分布族是的共轭先验分布(族)。二项分布b(n,
)中的成功概率的共轭先验分布是贝塔分布Be(a,b);泊松分布P(
)中的均值的共轭先验分布是伽玛分布Γ(,);指数分布中均值的倒数的共轭先验分布是伽玛分布Γ(,);在方差已知时,正态均值的共轭先验分布是正态分布N(,2);在均值已知时,正态方差2的共轭先验分布是倒伽玛分布IΓ(,)。5)贝叶斯风险定义:称为决策函数d(X)在给定先验分布(
)下的贝叶斯风险,简称d(X)的贝叶斯风险相当于随机损失函数求两次期望,一次对后验分布,一次对X的边缘分布6)贝叶斯点估计定义:设总体X的分布函数F(x,)中参数为随机变量,()为的先验分布,若在决策函数类D中存在一个决策函数d*(X),使得对决策函数类D中的任一决策函数d(X),均有
则称为d*(X)参数的贝叶斯估计量定理3.2设的先验分布为(),损失函数为L(,d)
=(-d)2,则的贝叶斯估计是其中h(|x)为参数的后验密度。定理3.3—3.7,给出了各种损失函数下的贝叶斯估计,不证定理3.3设的先验分布为()
,取损失函数为加权平方损失函数则的贝叶斯估计为定理3.4
设(1,2,…,p)T
的先验分布为()
,损失函数为则的贝叶斯估计为定义:设d=d(x)为任一决策函数,损失函数为L(,d),则L(,d)对后验分布h(|x)的数学期望称为后验风险,记作
若存在一个决策函数d*(x)使得则d*(x)称为在后验风险准则下的最优决策函数定理3.5对给定的统计决策问题(包括先验分布)和决策函数类D当满足则贝叶斯决策函数d*(x)与贝叶斯后验型决策函数d**(x)等价定理3.6设的先验分布为()
,损失函数为绝对值损失则的贝叶斯估计d*(x)为后验分布h(|x)的中位数定理3.7设的先验分布为()
,在线性损失函数下,则的贝叶斯估计d*(x)为后验分布h(|x)的k1/(k0+k1)上侧分位数常用贝叶斯估计基于后验分布h(x
)的贝叶斯估计,常用如下三种:用后验分布的密度函数最大值作为
的点估计,称为最大后验估计;用后验分布的中位数作为
的点估计,称为后验中位数估计;用后验分布的均值作为
的点估计,称为后验期望估计。用得最多的是后验期望估计,简称为贝叶斯估计,记为。求贝叶斯估计的一般步骤1.根据总体X的分布,求得条件概率q(x|)
2.在已知
的先验分布()下,求得x与的联合分布密度f(x,)=()q(x|)3.求得X的边缘分布m(x)4.计算h(|x)=()q(x|)/m(x)5.求数学期望6.求得贝叶斯风险(如果需要的话)例3.11设总体X~B(1,p),其中参数p未知,且服从[0,1]上的均匀分布,损失函数取二次损失函数L(,d)
=(-d)2,求参数p的贝叶斯估计及贝叶斯风险若在试验前对事件A没有什么了解,对其发生的概率
也没有任何信息。贝叶斯本人建议采用“同等无知”的原则使用区间(0,1)上的均匀分布U(0,1)作为
的先验分布,因为取(0,1)上的每一点的机会均等。贝叶斯的这个建议被后人称为贝叶斯假设。某些场合,贝叶斯估计要比极大似然估计更合理一点。比如:“抽检3个全是合格品”与“抽检10个全是合格品”,后者的质量比前者更信得过。这种差别在不合格品率的极大似然估计中反映不出来(两者都为0),而用贝叶斯估计两者分别是0.2和0.83。由此可以看到,在这些极端情况下,贝叶斯估计比极大似然估计更符合人们的理念。例设总体X~N(,1),其中未知,假定~N(0,1),对于给定的损失函数L(,d)
=(
-d)2,求的贝叶斯估计量例3.15X1,X2
,
…,Xn来自正态分布N(
,02)的一个样本,其中02已知,
未知,假设的先验分布为正态分布N(
,2),其中先验均值
和先验方差2均已知,试求
的贝叶斯估计。解:样本x的联合分布和
的先验分布分别为由此可以写出x与的联合分布其中,若记则有
注意到A,B,C均与
无关,样本的边际密度函数
应用贝叶斯公式即可得到后验分布
这说明在样本给定后,
的后验分布为N(B/A,1/A),即|x~N(B/A,1/A)
后验均值即为其贝叶斯估计:它是样本均值与先验均值的加权平均。贝叶斯估计的误差贝叶斯区间估计两种区间估计的区别1)构造一个统计量,并求得其概率分布2)利用参数的后验分布区间估计求解步骤前面同贝叶斯点估计;求得后验分布后按置信度,分开单侧、双侧查表,得出置信上下界。注意:贝叶斯区间估计的置信区间较短;贝叶斯点估计不再要求无偏性。例3.15x1,x2
,
…,xn来自正态分布N(
,02)的一个样本,其中02已知,
未知,假设的先验分布为正态分布N(
,2),其中先验均值
和先验方差2均已知,试求
的贝叶斯区间估计。解:由贝叶斯点估计知例3.16对某一儿童做智力测验x=115,设结果为X~N(,100),为智商,根据经验~N(100,225),求该儿童智商的0.95贝叶斯置信区间解:由上题结论知,的后验分布服从正态分布
最大最小估计(极大极小)minmax定义:设D是决策函数的集合,若有d*(x)=d*(x1,x2,…xn),d*∈D,使得对任意一个决策函数d(x1,x2,…xn),总有
则称d*为最大最小决策函数,当上界能取到时可记为解题步骤(1)对D中所有决策函数求最大风险(2)在所有最大风险值中选取最小值此最小值所对应的决策函数就是最大最小决策函数。例设总体X服从两点分布,试求p的极大极小估计量,其中L(p,d)d=0.25d=0.5P1=0.2514P2=0.532解:决策空间为A={0.25,0.5},选取容量为1的子样,x只能取0,1a只能取0.25,0.5,则决策函数d(x)有四个:dxad1(x)d2(x)d3(x)d4(x)00.250.50.250.510.250.50.50.25风险函数R(p,d)R(p1,di)R(p2,di)maxR(pi,dj)d1133d2434d37/45/25/2d413/45/213/4min(maxR(pi,dj))=5/2则极大极小估计为R(p,d)计算举例例:地质学家把地层状态分为0,1两种,并把当地无石油记为0,有石油记为1,分布规律如下表
x010
(无油)0.60.41(有油)0.30.7决策空间为A={a1,a2,a3},其中a1为钻探石油,a2为出卖土地,a3为开发旅游。损失函数L(
,a)取下表aa1a2a30(无油)12161(有油)0105决策函数d(x)取下表(取n=1)(9个决策函数)x1d1d2d3d4d5d6d7d8d90a1a1a1a2a2a2a3a3a31a1a2a3a1a2a3a1a2a3风险函数R(i,dj)及最大值表di(x1)d1d2d3d4d5d6d7d8d9R(0,di)127.69.65.4138.446R(1,di)073.53106.51.58.55maxR(,di)127.69.65.4106.58.48.56可知:min(maxR(,di))=5.4,其对应的决策函数为d4,所以d4是这个统计决策问题的最大最小决策函数。
d4为:d4(0)=a2,d4(1)=a1即当地质学家的结论是无油时出卖土地,有油时钻探石油。R(,d)计算举例定理3.8给定一个统计决策问题,如果存在某个先验分布下的贝叶斯决策函数的风险函数是一个常数,那么该决策函数必定是这个统计问题的一个最大最小决策函数。若给定的统计决策问题是参数的点估计,在定理条件下,相应的决策函数必为参数的最大最小估计量例3.18设总体X~B(1,p),p未知,服从分布损失函数为L(,d)
=(-d)2,参数p的贝叶斯估计为p的最大最小估计定理3.9给定一个贝叶斯决策问题,设{k(
):k
≥1}为参数空间Θ上的先验分布列,{dk:
k≥1}和{RB(dk)}:k≥1}分别为相应的贝叶斯估计列和贝叶斯风险列,若d0是的一个估计,且风险函数满足,
则d0为的最大最小估计定理3.10给定一个贝叶斯决策问题,若d0是的一个估计,其风险函数R(,d0)在参数空间Θ上为常数ρ,且{k(
):k
≥1}为先验分布列,使得相应的贝叶斯估计列{dk:
k≥1}的贝叶斯风险满足
则d0为的最大最小估计例3.19x1,x2
,
…,xn来自正态分布N(
,1)的一个样本,设的先验分布N(0
,2),其中2已知,在0-1损失函数下的贝叶斯为估计证明样本均值是的最大最小估计证明:由例3.15知的贝叶斯为估计为几种特殊情况下的投资决策设备更新决策设备更新决策是比较设备更新与否对企业的利弊。通常采用净现值作为投资决策指标。设备更新决策可采用两种决策方法,一种是比较新、旧两种设备各自为企业带来的净现值的大小;另一种是计算使用新、旧两种设备所带来的现金流量差量,考察这一现金流量差量的净现值的正负,进而做出恰当的投资决策。例(教材97-98页)
方法1,新旧设备净现值比较继续使用旧设备:每年经营现金流量为20万元,净现值为:NPV=20万元×PVIFA(10%,10)=20万元×6.145=122.9万元使用新设备:初始投资额=120-10-16=94(万元)经营现金流量现值=40×PVIFA(10%,10)=40×6.145=245.8(万元)终结现金流量现值=20×0.386=7.72(万元)净现值=-94+245.8+7.72=159.52(万元)由于使用新设备的净现值大于继续使用旧设备的净现值,故采用新设备。方法2:差量比较法初始投资额=120-10-16=94(万元)经营现金流量差量=40-20=20(万元)经营现金流量差量现值=20×6.145=122.9(万元)终结现金流量现值=20×0.386=7.72(万元)现金流量差量净现值=-94+122.9+7.72=36.62(万元)设备比较决策这一决策比较购置不同设备的效益高低。一般来讲,进行这一决策时应比较不同设备带来的成本与收益,进而比较其各自净现值的高低。但有时我们也假设不同设备带来的收益是相同的,因而只比较其成本高低即可。很多情况下,不同设备的使用期限是不同的,因此我们不能直接比较不同设备在使用期间的净现值大小,而需要进行必要的调整。这种调整有两种:一种是将不同设备的净现值转化为年金。一种是将不同设备转化为相同的使用年限。例:(教材98-99页)
设备A、B的使用期间成本现值分别为643573元和471622元,虽然B设备的成本现值小于设备A,但使用期限也小于设备A,所以二着不能直接比较。方法1,等年金比较年金现值公式:PV=A×年金现值系数所以:A=PV/年金现值系数A设备的成本现值=40+6.1×PVIFA(8%,5)=40+6.1元×3.993=64.36万元其年金为:AA=64.3
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 安徽省安全员-B证考试题库及答案
- 陕西省安全员考试题库及答案
- 吉林建筑大学《三维建模与材质渲染》2023-2024学年第一学期期末试卷
- 吉林化工学院《半导体材料与器件》2023-2024学年第一学期期末试卷
- 《康复新液促进克罗恩病肛瘘挂线引流术后创面愈合的临床研究》
- 《基于Android的小微商户移动收银系统设计与实现》
- 工程施工检讨书范文
- 食用菌种植基地建设施工组织设计方案
- 社区卫生服务中心耗材合同
- 吉林工商学院《大学体育-健身街舞》2023-2024学年第一学期期末试卷
- 钢丝绳在卷筒上旋向的判断
- 西班牙授权书委托书格式委托书
- 旅游学基础-河南大学中国大学mooc课后章节答案期末考试题库2023年
- GB/T 19367-2022人造板的尺寸测定
- 人教版高中历史 第13课 辛亥革命 【公开课教学PPT课件】
- 补全句子专项预习(试题)外研版英语三年级上册
- 药理学题库(含答案)
- Minitab-培训教程大全-500多页
- 水质工程学课程设计
- 河北省工程质量材料检验收费标准
- GB/T 36073-2018数据管理能力成熟度评估模型
评论
0/150
提交评论