




已阅读5页,还剩49页未读, 继续免费阅读
(通信与信息系统专业论文)认知无线电网络动态资源管理与分配策略研究.pdf.pdf 免费下载
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
重庆大学硕士学位论文中文摘要 摘要 无线通信业务需求的爆炸式增长和服务质量要求的不断提高,要求无线通信 网络必须利用有限的频谱资源,不断寻求提高系统容量和覆盖能力的技术途径。 认知无线电作为一种智能频谱共享技术,具有环境意识、行为意识和目标意识, 允许在时域、频域和空域上进行多维的频谱复用和共享。博弈论是一种利用数学 模型解决决策及决策均衡的理论。通信用户之间竞争有限的网络资源,可以通过 建立博弈模型,利用博弈论设计高效、可靠的资源管理与分配策略。 本文围绕认知无线电网络动态资源管理和分配策略开展研究,利用非合作博 弈论建立数学模型,通过分析纳什均衡及其特性,验证运用博弈论解决认知无线 电网络资源分配问题的可行性,并提出两种基于博弈论的资源管理与分配算法: 针对集中式认知无线电网络,提出一种联合资源评价的非合作博弈资源分配 算法( j o i n tr e s o u r c e se v a l u a t i o na n da l l o c a t i o na l g o r i t h mb a s e do nn o n - c o o p e r a t i v e g a m e ,j r e a ) 。利用基站搜集的统计数据对主用户占用频谱进行定量评价,并对认 知用户进行调度和资源分配;基于主用户可容忍的干扰值门限确定网络中每个用 户的发射功率上限,同时结合认知用户业务的q o s 需求设计功率分配算法的效用 函数,并分析其收敛性。仿真验证结果表明,该算法收敛较快,在低信噪比通信 环境下也能保证每个用户的信干噪比( s i n r ) 高于q o s 需求门限,同时降低对主 用户的干扰,提升网络性能。 针对通信用户无法获得完全信息的分布式认知无线电网络,设计了一种用户 接入和信令交互过程,通过生成网络可用信道优先度表评价信道可用性和质量, 构建基于e w a 的学习博弈模型,提出一种基于信道优先度与认知用户间干扰的 e w a 学习博弈抽象的信道选择算法。仿真验证结果表明,该算法可通过对历史经 验的学习,自适应选择可用性最优信道,能增加系统有效吞吐量,并保证资源分 配的公平性。 关键词:认知无线电,资源管理与分配,非合作博弈,e w a 学习博弈,效用函数 a b s t r a c t a st h ee x p l o s i v eg r o w t ho fw i r e l e s sc o m m u n i c a t i o n sb u s i n e s s n e e d sa n dt h e c o n t i n u o u si n c r e a s eo ft h eq o sr e q u i r e m e n t s ,w i r e l e s sc o m m u n i c a t i o nn e t w o r ks h o u l d c o n s t a n t l ys e e kt h et e c h n i c a la p p r o a c ht oi m p r o v et h es y s t e mc a p a c i t ya n dc o v e r a g e w i t ht h el i m i t e ds p e c t r u mr e s o u r c e s a sa ni n t e l l i g e n ts p e c t r u ms h a r i n gt e c h n o l o g y , c o g n i t i v er a d i oh a s t h ee n v i r o n m e n t a lc o n s c i o u s n e s s , b e h a v i o rc o n s c i o u s n e s sa n d p u r p o s ec o n s c i o u s n e s s ,m e a n w h i l e ,i ta l l o w sm u l t i d i m e n s i o n a ls p e c t r u mr e u s ea n d s h a r i n gi nt h et i m e ,f r e q u e n c ya n ds p a t i a l d o m a i n g a m et h e o r yi sam a t h e m a t i c a l m o d e lt os o l v et h ed e c i s i o n m a k i n gp r o b l e m sa n db a l a n c eo fd e c i s i o n s c o m p e t i n gf o r l i m i t e dn e t w o r kr e s o u r c e sb e t w e e nc o m m u n i c a t i o nu s e r sc a nb em o d e l e da sag a m e m o d e l ,w i t hi t ,a ne f f i c i e n ta n dr e l i a b l er e s o u r c em a n a g e m e n ta n da l l o c a t i o ns t r a t e g y c a nb ed e s i g n e d t h i sp a p e rf o c u s e do nt h ed y n a m i cr e s o u r c em a n a g e m e n ta n da l l o c a t i o ns t r a t e g i e s o ft h ec o g n i t i v er a d i on e t w o r k ,u s e dn o n c o o p e r a t i v eg a m et h e o r yt oe s t a b l i s ht h e m a t h e m a t i c a lm o d e l t h ef e a s i b i l i t yo fs o l v i n gt h ep r o b l e mo fc o g n i t i v er a d i on e t w o r k s r e s o u r c ea l l o c a t i o nw i t hg a m et h e o r yw a sv e r i f i e db ya n a l y z i n gt h en a s he q u i l i b r i u m a n di t sc h a r a c t e r i s t i c s t h e n ,t w ok i n d so fr e s o u r c em a n a g e m e n ta n da l l o c a t i o n a l g o r i t h mb a s e d o ng a m et h e o r yw e r ep r o p o s e d : f o rt h ec e n t r a l i z e dc o g n i t i v en e t w o r k ,p r o p o s e djo i n tr e s o u r c e se v a l u a t i o na n d a l l o c a t i o na l g o r i t h mb a s e do nn o n c o o p e r a t i v eg a m e ( j r e a ) t h ea l g o r i t h mc o l l e c t s s t a t i s t i c a ld a t at h r o u g ht h eb a s es t a t i o n ,c a r r i e so u tt h eq u a n t i t a t i v ee v a l u a t i o no ft h e s p e c t r u mo c c u p i e db yt h ep r i m a r yu s e ra n dt h es c h e d u l i n gm a n a g e m e n t f o ro fc o g n i t i v e u s e r si nn e t w o r k d e t e r m i n e st h em a x i m u mt r a n s m i tp o w e ro fe a c hu s e ri nt h en e t w o r k t h r o u g ht h et o l e r a b l ei n t e r f e r e n c et h r e s h o l do ft h ep r i m a r yu s e r s ,t h e nw ed e s i g n e dt h e u t i l i t yf u n c t i o no ft h ep o w e ra l l o c a t i o na l g o r i t h mc o n s i d e r e dw i t ht h e t h eq o sd e m a n d s o fc o g n i t i v eu s e r sa n da n a l y z e di t sc o n v e r g e n c e t h es i m u l a t i o ns h o w st h a tt h e p r o p o s e da l g o r i t h mc o n v e r g e sf a s t ,c a ns t i l le n s u r e se a c hu s e r ss i n rv a l u eh i g h e rt h a n i t sq o sd e m a n dt h r e s h o l di ni n c r e a s i n gn o i s ee n v i r o n m e n t ,r e d u c et h ei n t e r f e r e n c et o p r i m a r yu s e r s ,a n de n h a n c en e t w o r kp e r f o r m a n c e f o rt h ed i s t r i b u t e dn e t w o r ka r c h i t e c t u r ei nw h i c hu s e r sa r eu n a b l et oo b t a i n c o m p l e t ei n f o r m a t i o n w ed e s i g n e du s e ra c c e s sa n ds i g n a l i n gi n t e r a c t i o np r o c e s s ,b u i l t t h ep r i o r i t yt a b l eo fa v a i l a b l ec h a n n e l si nn e t w o r k ,b u i l te w a ( e x p e r i e n c e - w e i g h t i i a t t r a c t i o n ) g a m el e a r n i n gm o d e l ,a n dp r o p o s eac h a n n e ls e l e c t i o nl e a r n i n ga l g o r i t h m b a s e do nc h a n n e lp r i o r i t ya n di n t e r f e r e n c eb e t w e e nc o g n i t i v eu s e r s s i m u l a t i o nr e s u l t s s h o wt h a tt h ea l g o r i t h mc a na d a p t i v e l ys e l e c tc h a n n e lw i t ht h eb e s tu s a b i l i t yt h r o u g h l e a r n i n go fh i s t o r i c a le x p e r i e n c e ,i n c r e a s et h ee f f e c t i v et h r o u g h p u to ft h es y s t e ma n d h a v eab e t t e re q u i t yi nt h er e s o u r c ea l l o c a t i o n k e y w o r d s :c o g n i t i v er a d i o ,r e s o u r c em a n a g e m e n ta n da l l o c a t i o n ,n o n c o o p e r a t i v e g a m e ,e w al e a r n i n gg a m e ,u t i l i t yf u n c t i o n i i i 重庆大学硕士学位论文1 绪论 1 绪论 1 1 研究背景与意义 随着无线通信技术的飞速发展,传统的静态( 固定) 频谱分配方式已越来越 显现出弊端,既无法适应无线网络中时变的带宽、速率、时延需求,也限制了频 谱的高效利用。 认知无线电( c o g n i t i v er a d i o ,c r ) 1 1 作为一种智能的无线电设计理念,具有 环境意识、行为意识和目标意识,允许在时域、频域和空域上进行多维的频谱复 用和共享,既能提供快捷、灵活的无线服务【2 】【3 1 ,也能有效提高资源利用率。认知 无线电利用环境感知,了解无线通信环境知识,并根据环境和网络中其他用户间 的互相作用自适应调整自身运行参数( 工作频率、发射功率、调制模式等) 。传统 的频谱共享和管理策略通常假设所有网络用户是在静态环境下无条件合作,无法 应用于认知无线电网络。 博弈论是一种用于分析多决策者之间决策互相影响的数学工具,可用来寻求 认知无线电网络资源管理和分配的最优解。首先,将网络用户( 主用户和认知用 户) 动态资源管理建模为博弈过程,利用博弈论丰富的研究成果分析网络用户的 行为和策略;其次,利用不同博弈环境下的最优化准则可以分析和寻求不同应用 场景和需求下认知无线电网络动态资源分配多目标优化问题的最优解,特别是利 用非合作博弈论,可以在仅有本地信息的条件下设计分布式资源分配算法。 本文依托国家自然科学基金“基于认知无线电的网格网拓扑管理、m a c 机制 和自适应资源分配策略研究( 6 0 8 7 2 0 3 8 ) ”,围绕认知无线电网络动态资源管理和 分配策略开展研究,利用非合作博弈论建立数学模型,通过分析纳什均衡及其特 性,验证运用博弈论解决认知无线电网络资源分配问题的可行性,并探索基于博 弈论的资源管理与分配算法。 1 2 国内外研究现状 在认知无线电网络中,通信用户可用频谱、时间和发射功率等资源都是时变 的,因此设计高效、合理、公平的资源管理和分配算法尤为重要。目前,国内外 学者对此进行了深入研究,已取得大量研究成果。 针对认知无线电网络频谱分配问题,认知无线电概念的提出者j o s e p hm i t o l a 博士提出了频谱共享池策略【4 j ,此后,该策略受到德国k a r l s r u h e 大学f i e d r i c h j o n d r a l 教授的关注,他领导的研究组在德国联邦研究和技术部移动通信项目的资 助下,开展了频谱共享池相关技术的研究。针对高效利用频谱资源研究,2 0 0 1 年, 重庆大学硕士学位论文 1 绪论 美国国防高级研究计划局( t h ed e f e n s ea d v a n c e dr e s e a r c hp r o j e c ta g e n c y , d a r p a ) 启动了下一代x g 计划【5 1 ,致力于开发频谱资源的多用户共享技术。为了缓解 w i m a x 标准商用的频谱匾乏问题,i e e e 成立了i e e e8 0 2 1 6 h 工作组【6 j ,专注改 进诸如增强的媒体接入控制等机制,协调基于i e e e8 0 2 1 6 的免许可通信系统之间 的共存,其中灵活高效的频谱分配策略是无线资源管理的重点研究内容之一。2 0 0 4 年,i e e e 成立i e e e8 0 2 2 2 工作组,启动w r a n 标准制定【7 】,旨在利用认知无线 电技术,将分配给电视广播的v h f u h f 频段用于无线宽带接入,其中合理的动态 频谱分配策略也是其研究的重点。 图论被大量应用于资源共享问题研究,p e n g 和z h e n g 等人采用图着色理论对 认知无线电频谱共享问题建模并提出一种分布式频谱共享算法,其综合性能与集 中式分配算法相当,但系统复杂性更低【8 】【9 】;文献 1 0 1 也基于图着色模型提出了三 种频谱共享算法分布式贪婪算法( d i s t r i b u t e dg r e e d ya l g o r i t h m ,d g a ) 、分布 式公平算法( d i s t r i b u t e df a i ra l g o r i t h m ,d f a ) 和分布式随机算法( d i s t r i b u t e d r a n d o m i z e da l g o r i t h m ,d r a ) ,分别以最高频谱利用率、保持一定频谱利用率下提 高公平性、降低系统复杂性和通信开销为目标;文献 1 1 】基于图论着色原理建立了 一种合作式频谱共享模型,提出一种快速信道调整算法( f a s tc h a n n e la d j u s t m e n t a l g o r i t h m ,f c a a ) ,在保证吞吐量和公平性的同时,进一步减小开销。 认知无线电网络以第二用户( s e c o n d a r yu s e r , s u ) 身份共享主用户( p r i m a r y u s e r , p u ) 网络的频谱资源,共存的前提是不允许对主用户造成严重干扰、不影响 主用户正常通信,因此,主次用户之间可以通过建立频谱买卖市场进行资源拍卖 与竞价,从而提高频谱资源的管理效率与利用率。基于拍卖的频谱分配模型的网 络结构一般采用集中式结构,中心接入点( a c c e s sp o i n t ,a p ) 或基站( b a s es t a t i o n , b s ) 在一次拍卖中充当拍卖人,而s u 则是投标者。在一个拍卖轮回中,每个投 标者根据自身需要给频谱资源投标,由拍卖人根据特定的原则确定胜利者。文献 1 2 提出一种基于“伯川德”垄断市场模型的认知无线电频谱资源分配算法,多个p u 管 理者竞价出让自己的空闲频谱,以损失自己服务q o s 等级为代价,获得一定收益, s u 结合自身需求与市场价格,提出频谱需求,通过为使用频谱付出一定代价满足 自身需求。该文进一步分析了信道质量、不完全信息与s u 需求、p u 管理者定价 之间的关系。文献【1 3 】通过建立市场均衡模型、竞争模型和协作模型来研究多主用 户、多次用户共存环境下资源供给与需求博弈,导出了博弈结果,分析了博弈结 果的效率以及信道质量、主用户业务量、信道自由切换因子等对博弈结果的影响, 并讨论了自适应策略的稳定性,比较分析了三种模型的性能、特点和信息量交互 开销以及与主用户间不完全情况下的博弈;文献 1 4 1 5 1 对多主用户、多次用户共 存环境构成的频谱交易网络可能形成的“用户勾结”行为进行了研究,并提出“最低 2 重庆大学硕士学位论文l 绪论 卖价”、“最高买价”、“贝叶斯机制”等反“勾结”机制。基于市场博弈模型的主次用 户买卖频谱管理与分配算法研究通过价格竞争机制能进一步提高资源利用率,但 用户与信道动态、均衡稳定性、反“勾结”机制以及健全的市场价格交易模型都还 有待深入研究。 博弈论又称为对策论,是现代数学的一个分支【l6 1 。博弈论是研究互动决策的 理论。所谓互动决策,即各行动方的决策是相互影响的,个体在决策时必须将他 人的决策纳入自身决策,同时也需要把别人对自己的考虑也纳入其中,并在循环 过程中选择最有利于自己的策略。d n i y a t o 等人提出一种非合作市场竞争博弈模 型用于频谱资源共享和分配,并与静态博弈模型进行了对比分析【1 7 】;文献【1 8 】利用 潜博弈模型,分别分析了以最大化用户收益和最大化系统收益为目标的信道分配 问题,但未考虑先验信息对当前分配的影响;文献 1 9 】提出一种基于连锁博弈的信 道分配算法,从时域角度引入关联均衡的概念,但如果认知无线电网络有新的用 户入网,其性能会迅速恶化;文献 2 0 研究分布式网络架构下非合作博弈中的多纳 什均衡问题,分析了效用函数变化对收敛性的影响,并提出一种非合作博弈算法, 以部分性能损失为代价获得算法的收敛性能;文献 2 1 以最大化所有认知用户效益 为目标,设计了一种分布式网络下合作博弈的效用函数,并证明了其纳什竞价的 唯一性,该算法能反映认知用户的频谱分配属性,获得高效公平的分配结果。文 献 2 2 研究了认知无线电网络下的r a p s 问题,即将主用户作为认知用户的中继, 主用户首先通过博弈过程选择预期数量的最佳信道,然后通过拍卖博弈将其分配 给认知用户。该文还证明了博弈纳什均衡的存在性、评估了算法的公平性。文献 2 3 1 以潜博弈和无悔学习算法为基础,提出一种改进的基于潜博弈的信道分配算法, 获得了最优容量性能,但信息交互开销较大。文献 2 4 分析了认知无线电网络中多 媒体业务的资源分配问题,将多媒体业务的可测性和时延等因素融入效用函数, 构建了三类拍卖博弈模型进行资源分配,保证主用户和认知用户在不同质量水平 内无缝切换,并获得最大效用。文献【2 5 提出一种基于配对博弈的分配算法,配对 博弈是一种合作博弈,可以模拟市场中的配对行为,如择业、择校、乘车等。文 献依据两方配对模型,每方都显示出对另一方中某个体的偏好。理论分析证明了 算法最优输出的稳定性。文献 2 6 2 7 将资源分配建模为库尔诺博弈模型,其中文 献【2 6 】用光谱相似矩阵表征频谱的差异性,设计了一种新的代价函数和对应的效用 函数,并分析了纳什均衡和效用函数迭代;文献【2 7 】研究了主用户的借贷频谱行为, 随着主用户数的增加,总的借贷数和价格随之变化。相比于静态分配算法,该算 法能增加认知用户可获得的借贷频谱数,并降低代价。文献 2 8 基于博弈论研究 i e e e8 0 2 2 2 中的用户频谱共存问题,设计了一种资源交易算法来实现动态资源租 赁和提供以及自适应按需信道竞争。首先对两个用户的分配解进行初步分析,然 重庆大学硕士学位论文l 绪论 后扩展到多个用户博弈。该算法能在获得公平性、提高吞吐量的同时,保证主用 户的收益最大化。文献1 2 9 分析了有效性和公平性这两个在资源管理中冲突的指 标,分别从个体理性和全体公平性角度,使用动态博弈论寻求最佳收益,提出一 种两步资源分配算法,首先关注个体效用,然后再考虑全局公平性,兼顾有效性 和公平性。 1 3 研究内容及章节安排 本文依托国家自然科学基金“基于认知无线电的网格网拓扑管理、m a c 机制 和自适应资源分配策略研究”,围绕认知无线电网络动态资源管理和分配策略开展 研究。针对认知无线电网络中环境动态变化以及资源的时间和空间差异性,探索 不同网络架构下高效、稳定的资源管理和分配算法。全文组织结构如下: 第一章:介绍认知无线电的研究背景、意义以及认知无线电资源分配的研究 现状,对论文的研究内容以及全文安排进行简要说明。 第二章:介绍认知无线电中博弈论基础,包括博弈论、非合作博弈、纳什均 衡等的基本概念;证明纳什均衡的存在性和唯一性,并分析博弈论用于资源分配 的可行性。 第三章:针对集中式网络架构下的资源分配算法进行研究。首先构建基于非 合作博弈的频谱共享模型,然后针对开放式接入模型,提出一种联合资源评价的 非合作博弈资源分配算法,并进行性能对比仿真分析,验证算法的有效性。 第四章:针对分布式网络架构下的资源分配算法进行研究。通过比较分析典 型的学习模型,在认知无线电动态资源管理和分配策略中引入e w a 学习博弈模型, 通过构建网络可用信道的优先度表对可用信道进行评价,利用该表设计e w a 学习 博弈抽象的信道选择算法,并进行对比仿真分析 第五章:全文研究工作总结,并对未来研究进行展望。 4 重庆大学硕士学位论文2 认知无线电网络中的博弈论基础 2 认知无线电网络中的博弈论基础 博弈论是一种用于分析多决策者之间决策互相影响的数学工具,可用来寻求认 知无线电网络资源管理和分配的最优解。本章介绍博弈论基础知识,为博弈论用 于认知无线电网络资源分配奠定理论基础。2 1 介绍博弈论基本概念;2 1 阐述非 合作博弈及其纳什均衡;2 3 分析在认知无线电网络中基于博弈论的动态资源分配 的可行性。 2 1 博弈论概述 2 1 1 博弈论发展历程 博弈论的提出可以追溯到j v o nn e u m a n n 等学者在1 9 4 4 年出版的博弈论与 经济行为专著【3 0 】,其中寻求二人零和博弈互相一致的解奠定了博弈论基础。2 0 世纪5 0 年代,博弈研究进入了一个全新发展阶段,纳什提出纳什均衡,为非合作 博弈奠定了理论基础。此后,博弈论研究走向成熟阶段,逐渐形成了比较完整的 博弈论理论体系,统一了博弈论基本概念,并在搏弈论与数理经济理论之间建立 了内在联系,如泽尔腾提出的“精练纳什均衡”;海萨尼提出的不完全信息理论,开 始了均衡选择问题研究,之后,不断拓展了博弈论新的应用领域,如进化博弈、 联盟博弈、重复博弈等【3 1 1 。时至今日,博弈论已成为人们分析和解决决策问题的 有效工具。博弈论除了在经济学领域得到深入研究和广泛应用之外,其基本思想 也对其他学科产生了重要影响,如将博弈论应用于政治、外交、计算机科学、哲 学等领域,同样包括本文所研究的通信领域。 2 1 2 博弈论定义 博弈论是用来分析多个决策者策略互相影响的数学工具,其中决策形式的博 弈模型中三个基本组件分别是: 一个有限的决策者集,定义为; 一个决策行为集,分别对每个决策者i 定义为4 ; 效益效用函数,定义为“,:a 专瓞,用于衡量由所有决策者行为决定的决 策者i 的决策结果,即a = 枷,4 。 通过上述定义和符号,博弈决策过程通常表征为 ,( 4 ) ,( “f ) ) 。 2 1 3 博弈论分类 博弈论有多种分类方式【3 2 1 ,比如根据参与人是否合作分为合作博弈和非合作 博弈;根据参与人数量分为两人博弈和多人博弈;根据博弈的不同结果分为零和 博弈、常和博弈和变和博弈等。 重庆大学硕士学位论文2 认知无线电网络中的博弈论基础 本文拟利用非合作博弈研究资源分配问题。合作博弈与非合作博弈的主要区 别是参与人是否合作。在合作博弈中,参与人在博弈过程中能够达成一个具有约 束力的协议,体现了集体的理性、效率、公正、公平;而在非合作博弈中,则突 出强调用户间的“竞争”,重点关注个人最优决策使得自身利益最大化,其结果通常 不满足集体理性,其前提是参与人的决策是理性的。 在认知无线电网络中,如果通信用户为追求不同目标而使自身性能最优,完 全的合作行为将不适用。非合作博弈是博弈论的一个重要分支,能使s u 仅利用局 部信息分析动态频谱分配性能,尤其在分布式网络结构中,利用非合作博弈能寻 求更加灵活高效的频谱分配方法。 在非合作博弈中,从博弈参与人的行动次序和在博弈中所获信息的差异角度 进一步细分为: 完全信息博弈和不完全信息博弈:按照参与人对其它参与人信息的了解程 度,博弈可以分为完全信息博弈和不完全信息博弈。在完全信息博弈中,博弈各 方都拥有其它博弈方的特征、策略集合和效用函数等信息;而在不完全信息博弈 中,博弈方仅知道上述部分信息。 静态博弈和动态博弈:按照行动是否有先后次序,博弈可以分为静态博弈 和动态博弈。在静态博弈中,参与人同时选择行动,或者虽不是同时,但后行动 者并不知道先行动者采取了什么具体行动;而在动态博弈中,参与人的行动有先 后顺序,并且后行动者能够观察到先行动者所选择的行动。 上述非合作博弈的分类如表2 1 所示。 表2 1 非合作博弈分类 ! 堕璺! 皇兰:! g ! 箜! i 堑里坐i 殳里q 望q 望里q 9 卫呈型i 呈g 璺塑曼 静态动态 2 2 非合作博弈和纳什均衡 2 2 1 纳什均衡 纳什均衡( n a s he q u i l i b r i u m ,n e ) 是完全信息静态博弈解的一种概念,是一 种最常见的博弈均衡。纳什均衡描述了一种策略集合,假设有门个决策者参与博弈, 以已知其他决策者行为基础,每个决策者都根据当前状态选择对自己最优的策略, 所有决策者的策略集合便构成纳什均衡。在达到纳什均衡后,如果其他决策者不 改变自身策略,当前决策对于该参与者就是最优的,没有决策者会主动偏离这种 6 重庆大学硕士学位论文2 认知无线电网络中的博弈论基础 策略,即此时任何改变自身策略的行为都会导致该参与者的效益降低。因此在纳 什均衡点上,每一个理性的决策者都不会有单方面改变决策行为的趋势。式( 2 1 ) 给出了纳什均衡的正式定义,具体表述如下: 定义2 1 :策略博弈 n ,( 4 ) ,( ”,) ) 的纳什均衡是指行为的策略组合a a 使得 对于每个决策者f n 都有: u ,( z ,d :,) “,( a i ,口:,) ( 2 1 ) 对于所有的q 4 ,其中a i 表示参与者i 的策略,口,表示除参与者i 之外的所有其 他用户的策略集合。 上述定义表明了在其他参与者都采用了纳什均衡点策略后,没有参与者可以 通过单方面偏离纳什均衡来获得更多效益,即纳什均衡为每个决策者定义了一个 最佳反应的策略集,即: a i 忍( t ,) ,f o ,a l li n ( 2 2 ) 其中,函数e 表示决策者i 的最佳反应函数,即: e ( 以,) = q 4 :1 , 1 i ( d _ j ,q ) u i ( 以,a ,) ) ,力,- a l la ,4 ( 2 3 ) 由式( 2 3 ) 不难看出,纳什均衡是所有博弈参与者策略行为的集合,一个均衡只 对应一种策略组合。 一种策略组合具有纳什均衡,必须保证这个策略集合中的每个策略与其他策 略都能形成互相最优反应,即当某一参与者决策确定时,其余决策者所选择是对 自己最优的策略;反之当其余决策者采取了确定的策略后,当前参与者所采用的 一定是对自己最优的策略。只有这样,博弈过程中的参与者在策略确定后才不会 单方面改变自身策略,从而达到一种稳定状态,也就是均衡。 2 2 2 均衡的存在性 根据纳什均衡的定义,博弈是否存在纳什均衡点对其应用非常重要。根据不 动点定理,可以得到以下定理 3 3 1 : 定理2 1 :对所有i n ,如果参与者i 的决策集彳i 是欧式空间的非空密凸子集, 其效用函数甜,是连续且在4 上是拟凹的,则此决策博弈 n ,( 4 ) ,( “,) ) 存在纳什均 衡。 如果决策者做出的决策是确定性的,此类决策称为纯策略,反之,如果参与 者的决策不是确定性的,并受概率规则约束,此类决策称为混合策略。假设( 4 ) 是4 的概率分布集合,则每个( 4 ) 都是参与者i 的一个混合策略。通常,决策者 之间做出的混合策略是互相独立的。假设( a i ) 删为参与者i 的决策集合,表示其在 行为集4 上的概率分布,则行为集的概率口= ( 哆) 删即为n 剧q ( q ) ,参与者在 决策集( q ) 洲下的效益是刚( 删q ( q ) 弦,( 口) 。 由定理2 1 可知,混合策略是纯策略上的概率衡量,可赋予弱收敛拓扑。混合 重庆大学硕士学位论文 2 认知无线电网络中的博弈论基础 策略的引入使得策略空间是凸的,收益对自身所选策略是线性的,对所有策略是 连续的( 当收益是纯策略的连续函数时,它们对混合策略也是连续的) ,而且反映 映射是凸值的。因此得到以下定理,其详细证明参见文献 3 3 : 定理2 2 :每个有限决策集的博弈都存在一个混合策略的纳什均衡。 因此,当一个博弈中的参与者拥有有限数决策行为时,其混合策略纳什均衡 可以由上述定理证明。 2 2 3 均衡的唯一性 除了存在性,均衡的唯一性也是其应用的重要前提条件。如果已知某博弈仅 存在一个均衡点,便可以通过优化调整博弈参数,操纵理性参与者的行为,使其 在均衡点实现资源共享。基于不动点定理,如果每个决策者的效用函数是严格凸 的、且其可行域也是凸的,则必然在博弈中存在唯一均衡。 纳什均衡给出了在其他参与者坚持其均衡策略时本参与者的最佳策略,但找 到纳什均衡非常困难,尤其是在系统以分布式方式运行时。通常是让决策者随着 博弈的展开,迭代进行累积观测,并希望该过程收敛到均衡点。尽管不一定真实, 但当博弈具有某种特殊结构时,迭代可以收敛并到达纳什均衡。例如,当博弈可 以被建模为潜博弈时,就能确保收敛到纳什均衡。 潜博弈 潜博弈理论最早由d m o n d e r e r 等人提出 3 4 1 ,j n e e l 等人将其应用于认知无线 电网络资源分配【35 | 。 定义2 2 :一个博弈 存在潜函数p :a r 使得以下条件中的某 一个成立,则称为潜博弈: 条件1 :p ( 口f ,of ) 一e ( o l ,以f ) = 甜f ( q ,of ) 一甜f ( a l ,哎。) f o ,a n yi n ,a a ,a n d 匆a t ; 条件2 :s g n ( p ( a f ,a 一,) 一e ( a l ,a ,) ) w - - s g n ( u ,( 口,以,) 一“f ( 口:,以,) ) 加,a n yf n ,a a ,a n d 反4 。 其中,s g n ( ) 是s i g n 函数。如果满足条件1 ,称该博弈为严格潜博弈;如果满足条 件2 ,则称该博弈为顺序潜博弈。 从定义可以看出,任何单个参与者的个人利益是与系统的整体利益( 即潜函 数) 一致的,任何参与者根据所有其他参与者当前决策来选择更好的策略都必然 会带来潜函数值的进一步改善。一个所有参与者都按顺序做出更好决策的潜博弈 将会在有限步内终止并到达可以最大化潜函数值的纳什均衡点。 文献 3 4 3 6 给出了关于潜博弈的一些定理,可用来证明一个博弈为潜博弈或 者用于指导设计新的潜博弈。 定理2 3 :当满足下列任意一个条件,博弈 即为具有潜函数尸( ) 的确切潜函博弈: 重庆大学硕士学位论文2 认知无线电网络中的博弈论基础 1 ) 当且仅当 拿= 霉,f o r a l lf,jnal 1 ( 2 4 ) l = 二_ ef ,4 l o a j o a jo a i o a j 假定4 属于实数区间,且u ,对于所有i n 是连续可微分的; 2 ) 当且仅当存在函数p o :a 专酞和暑:4 ,专r ( f n ) ,使得 “,( q ,以,) = e o ( q ,以,) + 只( 吼a 力,a 1 1 f n ( 2 5 ) 其中p ( q ,吼,) = e o ( a , ,af ) ; 3 ) 如果存在函数弓:4 4 专r 和只:4 专瓞使得弓( q ,乃) = 己( 哆,q ) ,且: u i ( 以) = p , j ( a i ,口j ) 一只( q ) ,f o ra l lf ,j na n da a ( 2 6 ) j e n i 标准函数 标准函数起初是用于蜂窝网络的功率控制【3 7 】。假设有n 个蜂窝用户,m 个基 站以及一个通用无线信道。定义b 为用户i 的发送功率,为用户i 到基站m 的信 道增益,n 。为基站m 处的噪声功率。将基站处的干扰作为噪声处理,可以得到用 户i 在基站朋处的信干噪比( s i n r ) : h ,1 广夏丽m , i 2 - 7 假设置是为用户i 分配的基站,为了保障可接受的通信质量,基站匆处的接收 功率应不低于某个门限y ,即p d - t 女:( p ) 7 ,其中p 是n 个用户的功率矩阵。因此, 干扰限制可以重写为一个干扰函数i ( p ) = ( i 。( p ) ,i ( p ) ) ,i j ( p ) 定义为: 只i ,( p ) = l( 2 8 ) 心, 已证明i ( p ) 是标准函数,其精确定义为【3 7 】: 定义2 3 :对于所有p 0 ,函数i ( p ) 的以下性质得到满足时,称为标准函数: 正则性:i ( p ) 0 单调性:如果p p ,则i ( p ) i ( p ) 可放缩性:对于所有a 1 ,ai ( p ) i ( a p ) 根据上述性质,可以证明基于标准函数p = i ( p ) 的同步迭代功率分配算法( 即 标准功率分配算法) 可以收敛到唯一不动点【3 7 1 。 定理2 4 :如果i ( p ) 是标准函数,则对于任何初始功率矩阵p ,标准功率分配 算法可以收敛至唯一不动点p + 。 在认知无线电网络中,每个通信用户的传输会对其他通信用户或主用户产生 干扰:一方面,如果认知用户占用与主用户相同的信道或使用较大的发射功率, 干扰更严重;另一方面,自私用户都希望通过增大发射功率使自己获得更高效用 或收益,因此,传统的资源分配可以建模为一个非合作资源分配博弈。如果最优 9 重庆大学硕士学位论文2 认知无线电网络中的博弈论基础 反应策略是表示参与者行为的一个标准函数,则该非合作资源分配博弈具备唯一 的均衡点3 8 1 。 2 3 基于博弈论的认知无线电网络资源分配 2 3 1 认知无线电网络动态资源分配 认知无线电利用具备的环境认知功能对主用户的工作状态进行感知,从而确保 能在不干扰主用户的前提下伺机接入主用户频谱。为了进一步提高感知获得的网 络资源的利用率,需要为认知无线电网络制定高效、动态的资源管理与分配策略。 在认知无线电网络中,用户可用资源( 工作频率、发射功率) 是时变的,传统的 固定资源分配策略无法满足需求。认知无线电网络资源分配策略必须确保对可用 资源的优化管理和利用,并避免或降低对主用户的干扰以及认知用户之间的互相 干扰,提高多网共存环境的整体性能。 在认知无线电网络中,依据认知用户接入频谱的性质不同,频谱共享和分配算 法分为两类,如表2 2 所示。一类是开放式频谱共享,指接入免申请频段的认知用 户间的频谱共享,此时,所用通信用户接入频谱的地位平等,但对不同用户的发 射功率有限制;另一类是等级接入,强调主用户出售或租借频谱以及认知用户的 购买占用行为,其典型应用是基于市场拍卖的频谱分配,主用户主动告知认知用 户当前可用频谱带宽,通过拍卖或竞价方式进行分配,此时,主用户和认知用户 都可以最优化各自利益。 表2 2 基于博弈论的认知无线电频谱共享 ! 璺垒! 里呈:至兰巳曼里! 望! 坐! 垒堑i 望gg 璺堡曼! i 望璺q g 璺i ! i 曼翌垒i q 望皇垒! q ! 坚! 开放式频谱共享 等级接入共享 认知用户实现频谱接入和共享的前提是保障主用户能正常通信,应尽可能避免 对主用户产生严重干扰,需要设计适用于认知无线电网络的功率控制算法。 在认知无线电网络中,用户之间既存在竞争又互相合作,一方面每个用户都想 要提升自己的通信质量,最大化发射功率;另一方面如果每个用户都最大化发射 功率,必将对主用户或其他认知用户造成严重干扰,导致网络整体性能下降。认 1 0 重庆大学硕士学位论文 2 认知无线电网络中的博弈论基础 知无线电网络功率控制既与主用户工作状态、地理位置、频谱质量有关,也与网 内各认知用户的行为有关。从合作角度出发,认知无线电网络功率控制可以建模 为合作博弈模型,但未考虑竞争因素,宜建模为非合作博弈模型,当然也可以利 用基于信息论的既有成果,如迭代注水法等,分析表明,该类算法可以通过增加 感知意识的学习机制来提升分配效率。 2 3 2 基于博弈论动态资源分配的可行性分析 j n e e l 等人 3 9 】率先将博弈论应用于认知无线电网络资源分配,给出了通信对象 必须满足博弈论的理性条件,主要包括: 条件一:决策过程需要规范。用户在通信环境中进行行为决策时,需要依据某 一确定性的行为准则,而非随机决策; 条件二:参与博弈的决策者在改变其策略行为时,对其改变后获得的效益要有 正确的预计。 要满足上述理性条件,要求通信系统中的每个用户博弈目标是一个严格设计的 目标函数。因此,合理有效的对通信用户的策略组合和效用函数进行定义,是进 行博弈建模的必要条件。 此外,利用博弈论研究资源分配问题,其研究对象还应满足构成博弈的基本条 件,主要包括: 1 ) 网络中必须有至少两个博弈的参与者或实体; 2 ) 博弈参与者可以选择的策略集必须包含至少两个策略或行为选项。 结合本文的应用场景,在无线网络环境下,通信用户必然会相互影响和干扰, 其博弈资源分配过程必定是多用户交互过程,否则该问题仅是最优化问题而非博 弈问题。此外,在认知无线电网络中,认知用户可以通过认知学习来获得当前通 信的各个参数,上述基本条件能够得到满足。 基于以上分析可知,认知无线电网络环境满足博弈论的应用条件。在认知用户 博弈中,参与者是认知用户,其行动是选择频谱需求或发射功率等参数,决策过 程是用户选择哪些可用资源,以何种功率等级实施通信。在认知无线电网络中, 通信用户会根据通信环境的变化和网内用户的策略来制定自身策略,并确定通信 参数。另外,一般情况下,各认知用户行为都是自私的,没有意愿进行互相合作。 因此,博弈论很适合于对这种智能行为以及自私网络用户进行建模。 2 4 本章小结 本章介绍了博弈论基础知识,为利用博弈论对认知无线电网络中的资源分配奠 定理论基础。首先介绍了博弈论的基本概念和发展历程,然后介
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 七年级生物下册 4.2.3 合理营养与食品安全教学设计 (新版)新人教版
- 人教版生物八年级下册7.2.4人的性别遗传 教学设计
- 人教版四年级下册第4课 主题与背景教案
- 七年级生物上册 第二单 第二章 第三节 动物的运动教学设计 (新版)济南版
- 2024四川巴东弘发产业发展集团有限公司公开招聘工作人员1人笔试参考题库附带答案详解
- 人教版八年级地理上册:4.2 农业 教学设计
- 人教部编版三年级下册3 荷花教案设计
- 七年级数学下册 第二章 相交线与平行线 3 平行线的性质第2课时 平行线的判定与性质的综合应用教学设计 (新版)北师大版
- 九年级道德与法治下册 第一单元 我们共同的世界 第二课 构建人类命运共同体 第2框谋求互利共赢教学设计 新人教版
- 2024北京国家金融科技风险监控中心有限公司招聘10人笔试参考题库附带答案详解
- 设计变更指令单
- 《高速铁路无砟轨道修理规则》第九章维修工机具、常备材料与作业车辆停留线课件
- 三年级《中国古代寓言故事》知识考试题库(含答案)
- 摩擦学发展前沿课件
- 招商银行入职培训招商银行新员工试题
- (通用版)医院收费员考试试题及答案
- 威海职业学院学籍档案簿
- 个人有关事项报告表(全)
- 锤击预应力管桩文明施工与环境保护
- 质量管理体系七项原则
- 装饰装修工程中的危险源辨识与风险评价表参考模板范本
评论
0/150
提交评论