放大转发合作通信的动态博弈模型_第1页
放大转发合作通信的动态博弈模型_第2页
放大转发合作通信的动态博弈模型_第3页
放大转发合作通信的动态博弈模型_第4页
放大转发合作通信的动态博弈模型_第5页
已阅读5页,还剩3页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、放大转发合作通信的动态博弈模型摘要合作无线通信协议是基于用户行为是以社会效率最大这一假设而设计的。在商业的无线网络内有些用户可能违反合作规则获取了合作的利益却没有付出,所以这一假设不能适用于商业无线网络。违反合作规则会造成违规的用户对其他用户展现出不确定性的社会困境。在社会困境里的合作可以用纳什均衡来描述。纳什均衡描述了不建立督察和减轻社会不良行为影响的机制的情况下而去维护一个优良的社会合作的难度。本文将用户在放大转发的合作视为不完全信息的纳什均衡。展示一个完美的贝叶斯均衡。索引词:Ad Hoc网络,通信系统安全,合作多样性,博弈论1.绪论多种多样的合作为的是提供多输入多输出系统的好处给每个用

2、户。所设想的绩效通过合作多样性协议来实现,如明显提高系统性能的放大转发(AF)【1】。合作多样性协议是基于直接互惠原则而设计的。在直接互惠原则里,用户会帮助其他用户以实现合作获取合作的成果,并在此过程中得到回报。当每个用户都遵守合作规则(也就是直接互惠),就会实现一个稳定的有社会效益的合作。在单一实体控制的无线网络下,限制了每个用户都向着一个共同的目标时,就可以实现。另一方面,商业无线网络的用户可以故意违反合作规则不作出回报,以期不做出贡献而坐享合作成果。注意到这种违反合作规则的意图是源于节省自身资源。因此在商业无线网络里,如果不引入惩罚不良行为以维护合作的机制,有社会效益的合作就不会轻易实现

3、。已经有很多确保用户遵守合作原则的机制被提出。在参考文献2,3中介绍了针锋相对的策略可以使得合作博弈向柏拉图最优的纳什均衡发展。在参考文献4中提出了一种依据合作定价策略,使得用户要承担传输自己的数据或者有用户转送给其它用户时占用通道所产生的费用。参考文献5把参考文献4中的定价策略扩展为多样性合作。特别地在文献中大体上,博弈论中的所说的合作都假设一个参与者同时做出抉择的静态博弈模型。换句话说,用户在做决定的时候并不知道其它用户的行为。所以,一个静态模型不能描述出在多样性合作里用户间相互影响的动态关系。在参考文献6里,提出了一个模拟在能源受约束的无线ad hoc网络里的路由选择的动态贝叶斯模型。本

4、文将用户在合作AF内的互动关系作为一个不完全信息的动态博弈过程进行阐述。这个动态博弈模型可以捕获合作通信的瞬时结构和信息结构。动态博弈的瞬时结构定义为以下顺序:合作传输按一定顺序发生,首先源合作用户发送请求,然后其它合作者决定与其合作(在进程中接收到信息用AF处理并转发),或者不合作。这一串合作传输受到无线网络设备的受约束半双工所支配,也就是一个中继端不能用相同的带宽同时进行发送和接收。动态博弈信息结构的特点是每位参与者再做决定的时候只知道:商业无线网络都希望每个用户都不知道先前的情况,因此不完全信息博弈描述了每个用户都不确定其他用户的意图。一旦中继端观测到源端的行为并做出决定后,用户间的多样

5、性合作就是一个Stackelberg博弈(领导者追随者)。一个不完全信息的动态博弈要在贝叶斯构架里研究,因此把贝叶斯博弈作为之前提到的博弈模型。所提到的动态博弈模型将会完全符合完美贝叶斯模型的条件。本文结构如下。第二部分针对AF合作描述系统模型。第三部分介绍一种针对AF合作的动态博弈模型。第四部分,总结。2.系统模型考虑N个时分多址的用户在多样性合作系统里以AF合作的方式转发信息给其它用户。假定用户(源端)在它周围所有相邻用户中尽可能大地搜集了潜在的合作者(中继端)。假定两个用户之间的传输(包括潜在的接受者)都有独立的锐利衰落。记为,分别为源端与接受者,源端与中继端,中继端与接受者之间的瞬时信

6、噪比(SNR)。在长数百万比特长的一帧里,信息以R b/s的速率传输。假定所有参与传输的用户在同一功率水平和同样的调制率。2.1.AF型合作在AF型合作里用户从其他用户那里收到了经过放大的有衰减和杂音的信号。放大系数记为,是用户的一个内部渠道增益功能,并受到中继端功率的制约【1】。2.2合作的规则假设每个有意愿合作的用户都经过握手协议来确认。有合作的意愿说明该用户有足够的功率去完成合作,还表明了有意节约其他用户的合作行为。2.3合作的收益与耗费合作的收益何以通过平均每帧成功率(FSR)来衡量。 (1)BER是平均接收比特错误由算出。假定使用BPSK调制。它表明了在单输入单输出系统里AF型显著出

7、错方面的性能提升【7】。合作的耗费是使得中继端在握手协议和转发信息时消耗能量, (2)是转发信息的能量耗费,是确认合作同伴的能量耗费。传输信息总的能量耗费是,其中源端的能量耗费。注:(,)。.效用函数在参考文献8里无线网络的效用函数定义是整个耗费的能量中每焦耳能量所传输的比特量。 (3)是用户的信息吞吐量,W是带宽,是整个合作的总消耗。注:因为在握手协议时没有传输比特,所以的效用为零。因此,公式(3)很好地定义了效用函数,就是说时,时。图一很好地说明了效用函数的变化。3.放大转发模型的动态博弈模型假定在合作获得的收益和引起的耗费上达成了共识,即用户愿意为了帮助其他用户实现可靠的通信而耗费自身能

8、量,并以在自身需要时可以得到帮助作为回报。并假定这些理性的聪明的用户都希望它们单个效用最大化。认为阶段的博弈发生在时刻,k=0,1,源端和中断端频繁相互作用持续T秒。假定在一个阶段博弈内,多个合作相互影响是有可能的,应为合作传输可以跨越多个时段。每个阶段博弈的周期为T可以定义为合作传输到预定目的地所需要的时间。假定阶段博弈的时间长得足以让人认为通道变化的作用已经平均。很明显,当一个源端i()开始向网络传输时,一个新的阶段博弈就开始了。接着就用动态贝叶斯博弈框架来描述源端i和中继端j的下一个行为。3.1.中继端的行为假定中继端的行为信息一直被记录(即合作或作弊)。私人信息是中继端在贝叶斯博弈内行

9、为种类的标记。这些行为种类集合定义为。每个中继端j不管是否合作,都被包含了,即。接下来是贝叶斯博弈的符号,参与者j的行为记为,其它参与者的行为记为,()。假设每个中继端的行为是独立的。每个中继端的行为样本空间对应一个行为样本空间,即定义一个集合用于记录参与者j的行为。假定在一个阶段博弈内,端j的行为即不改变。实际上中继端在一个阶段博弈内事会执行合作而不改变的。而作弊的中继端却有可能在每个阶段博弈的一开始有策略地改变自己的行为。本文假设作弊的中继端可以在每个阶段博弈中随意改变自己的行为。行为策略在内表示一个条件概率,即。图二. 展示的博弈树图是AF动态贝叶斯博弈中中继端采取行为策略的一个实例,即

10、中继端随意决定合作或作弊。N点表示参与者所拥有的选择的种类。每一个时刻中继端所拥有的行为策略由两个点表示。包围的曲线表明中继端将会采取哪个行动(合作或作弊)。根据动态博弈术语,中继端在自己的信息集内有两个节点。而只有单一类型(信息集里只有一个元素),即无论何时它有信息要发送就必须向网络传输。例如遵守合作的中继端的信息集就是单一集合。请注意博弈历史记录和中继端的行为的条件。假设博弈的历史记录在阶段博弈开始时刻时为可以放心假设不守规则的中继端在选择行为时可以不观察博弈的历史记录。思考一个例子,观察里面AF合作的行动样本空间和行动类型。定义时中继端放大系数为,表示中继端j选择了行为,倍的放大是由于通

11、道和功率的限制。描述以下几种中继端j的行为类型。 中继端j服从合作规则:,它的行为样本空间。端j将执行纯策略(即=1),假设源端i选择了行为类型,而。此时放大系数的集合B受到通道动态函数和功率的限制,。 中继端j违反了合作规则:,行为样本空间,要注意中继端不会遵守博弈规则,也就是说当它做出确定时会参考博弈的历史记录。中继端的行为映射到它的行为选择到,即对应,对应1-,是一种行为策略。发达系数集合表明作弊的端有1-的概率拒绝转送(B=0),有的概率转送(B=)。当以概率=1, 时中继端可以一直拒绝转送,很明显此时B=0。 一个聪明(但自私)的中继端j,选择行为策略,试图在转发时通过随机减低自己的

12、传输功率作弊。这个中继端的目标是通过自己的合作耗费最小化以达到效用最大化。自私的中继端j的行为样本空间是以的概率触发。因为所以。要注意所展示的端模糊的行为会利用通道的动态性来避免被监管机制侦查到(如果有监管机制的话)效用驱使着各个端选择自己的行为类型如图三所示:3.2.源端的行为即使每个潜在的合作者都保留有私人信息,源端仍以每个中继端j行为类型的可信概率为依据。源端可信概率定义为在源端i的行为类型和博弈的历史记录已经给出的情况下中继端选择的概率。假设整个网络的可信概率是相互独立的,而且每个源端i而言中继端j选择的可信概率严格为正,即。在用动态用户数来描述商业无线网络里,当难以定义每个用户行为的

13、先验知识时,这样是直观正确的。尽管不知道每个源端的可信概率,但中继端知道博弈的信任构成。如果一直相信,用户就会偏离现已存在的合作协议的一直合作的假定。因此,可信概率是源端在存在作弊情况时制定最优策略的可靠参数。一个用户的可信概率描述了在多样性合作的系统里它与其它用户合作的可信程度。例如,用户很有可能与其它可信的用户合作。3.3.可信概率系统可信概率系统定义为在每个阶段博弈的最后用贝叶斯公式更新源端i的可信概率。假定每个源端i运用文献10介绍的作弊行为检测技术检测互动合作以了解中继端j的行为类型。这个检测机制的成果是在每个阶段博弈的结束时更新源端i的可信概率。在阶段博弈后的可信概率为 (4)当,

14、时【9】。是行为被发现的概率。阶段博弈结束时的可信概率将会是阶段博弈开始时可信概率。所提出的动态贝叶斯博弈模型完全满足文献11所提出的完美贝叶斯均衡的必要条件。1. 在每个信息集里改变的参与者都有它信息集内的节点的可信概率。2. 参与者是有序的理性的,即轮到它选择的时候它必须选择一个最优策略。3. 用贝叶斯公式计算可信概率。因为在行动样本空间已经简明定义了,所以忽略在集合中没有现实意义的第四个必要条件。由于源端的信息集是单集(图二)可以认为其概率为1,所以满足必要条件一。就是说无论何时只要源端需要就会立即向网络传送信息如图二所示。必要条件二所遇到的问题已经解决了。必要条件四中的可信概率系统满足必要条件三。因此所提出的动态博弈模型满足完美贝叶斯均衡。每一个大的博弈都

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论