认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 硕士论文.doc_第1页
认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 硕士论文.doc_第2页
认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 硕士论文.doc_第3页
认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 硕士论文.doc_第4页
认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 硕士论文.doc_第5页
已阅读5页,还剩85页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

硕士学位论文认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现申请人:冯冀学科专业:信息与通信工程指导教师:罗新民 副教授2008年05月study of power control and spectrum allocation and implementation of close loop power control in cognitive radio systema thesis submitted toxian jiaotong universityin partial fulfillment of the requirementsfor the degree ofmaster of engineering sciencebyji feng(information and communication engineering)supervisor: associate prof. xinmin luomay 2008摘 要论文题目:认知无线电系统功率控制和频谱分配技术研究与闭环功率控制实现 本研究得到国家高技术研究发展计划(“863”计划)(编号:2005aa123910),陕西省自然科学基金项目(编号:2006f41),陕西省科技攻关计划项目(编号:2005k04-g11)资助。学科专业:信息与通信工程申请人:冯冀指导教师:罗新民 副教授摘 要认知无线电技术能够主动检测频谱使用情况,自适应的改变自身通信参数。在不影响授权用户的前提下,择机选择授权用户的空闲频段进行通信,具有灵活、频谱利用率高等优点,因而引起了国内外研究者的广泛关注。由于认知无线电用户与授权用户共享频段,且授权用户具有最高优先级,使认知无线电相关技术具有新的特点。论文对认知无线电系统的功率控制和频谱分配技术展开研究,并设计实现了认知无线电实验系统上的闭环功率控制模块。首先,论文在分析认知无线电自适应、交互式决策过程的基础上,建立了功率控制的博弈论模型。针对采用非共享机制的认知无线电系统,提出了基于函数的功率控制博弈算法。仿真结果表明:与已有算法相比,新算法在保证认知无线电用户信干噪比的前提下,提高了系统吞吐量。针对采用共享机制的认知无线电系统,改进了效用函数,提出了基于指数惩罚系数的功率控制博弈算法。仿真结果表明:新算法保障了授权用户足够低的掉线概率和认知无线电用户的信干噪比,有效控制了发射功率。其次,针对采用ofdm技术的认知无线电系统中占用信道数和时间开销的矛盾,论文提出实际吞吐量的概念及基于此概念的一种最优频谱分配策略,并设计了基于遗传算法的最优策略求解方法。仿真结果表明:当分配给认知无线电用户的频谱资源较少时,实际吞吐量随着分配的频谱资源的增多而增大。随着占用的频谱资源进一步增多,与授权用户发生冲突的概率增大,实际吞吐量反而呈单调下降趋势。论文提出的策略对认知无线电用户占用信道数进行了优化,提高了系统性能。最后,论文在调试认知无线电实验系统射频模块的基础上,设计并实现了闭环功率控制模块。调试结果表明:在射频模块工作正常的基础上,本模块能够对发射功率进行准确、实时的控制;在移动情况下,能够对信道增益的变化做出及时补偿,保障了接收端足够高的信噪比和足够低的误码率。关 键 词:认知无线电;博弈论;功率控制;频谱分配;闭环论文类型:应用研究75abstracttitle:study of power control and spectrum allocation and implementation of close loop power control in cognitive radio systemthis research was funded by the national high-tech research and development plan(”863” plan)(no.2005aa123910),shaanxi province natural science fund(no.2006f41)and shaanxi province scientific and technological plan(no.2005k04-g11).speciality:information and communication engineeringapplicant:ji fengsupervisor:associate prof. xinmin luoabstractcognitive radio technology can detect the utilization of the spectrum initiatively, and change its communication parameters adaptively. on the premise of no prejudice to licensed users, cognitive radio can choose the idle spectrum of licensed users to communicate in proper opportunities. for its advantages of agility, and high spectrum utilization, cognitive radio has been concerned widely by the scholars at home and abroad. because licensed users share spetrum resource with cognitive users and have the highest priority, the technologies in cognitive radio have new characteristics. the technologies of power control and spectrum allocation in cognitive radio systems is researched, and close loop power control module in cognitive radio experimental system is designed and implemented in this thesis.firstly, based on the analysis of adaptive and interactive decision process in cognitive radio, a game theory model of power control is established. aimed at cognitive radio system based on exclusive model, a power control game algorithm based on arctan function is proposed. the simulation results show that new algorithm not only guarantees the cognitive users sinr,but also imporves the system throughput compared with other algorithms. aimed at cognitive radio system based on common model, the utility function is improved,and a power control game algorithm based on exponent chastisement factor is proposed. the simulation results show that new algorithm guarantees the sinr of cognitive users and low enough outage probability of licensed users, and the transmitting power is controlled effectively.secondly, aimed at the contradiction between number of occupied channels and time cost in ofdm cognitive radio system. a goodput concept and an optimal spectrum allocation strategy based on this concept are proposed. and a method based on genetic algorithm for the solution of the optimal strategy is designed. the simulation results show that when the spectrum resource allocated to the cognitive users is small, the goodput increases with the increase of allocated spectrum resource; when the occupied spectrum resource by cognitive users increases further, the conflict probability to licensed users increases, and the goodput decreases monotonically with the increase of allocated spectrum resource. this strategy proposed in the thesis optimizes the number of occupied channels by cognitive users, and improves the ofdm cognitive radio system performance.finally, close loop power control module in cognitive radio experimental system is designed and implemented based on debugging of rf module in experimental system. the debugging results show that transmitting power can be controlled accurately and in real-time by this module based on rf modules normal operation; when the experimental terminal is moving, the change of channel gain can be compensated in time, and snr and ber in receiver can be guaranteed.key words: cognitive radio; game theory; power control; spectrum allocation; close looptype of thesis: applied research目 录绪论目 录1 绪论11.1 选题背景及意义11.2 认知无线电的定义及研究现状21.3 论文完成工作与结构安排32 博弈论及其在认知无线电中的应用52.1 博弈论概述52.1.1 博弈论的定义52.1.2 博弈论的基本模型及分类62.1.3 纳什均衡的分析和求解72.2 博弈论在认知无线电中的应用102.2.1 认知无线电的交互作用102.2.2 博弈论在认知无线电中的应用112.2.3 认知无线电功率控制算法的博弈论建模122.3 本章小结133 基于博弈论的认知无线电功率控制算法143.1 现有的基于博弈论的功率控制算法143.1.1 sinr平衡算法143.1.2 saraydar-mandayam算法153.1.3 koskie-gajic算法163.1.4 现有算法小结173.2 基于非共享机制的认知无线电系统功率控制算法173.2.1 基于非共享机制的认知无线电系统模型173.2.2 算法的博弈论建模193.2.3 纳什均衡求解和算法流程223.2.4 算法收敛性证明243.3 基于共享机制的认知无线电系统功率控制算法253.3.1 干扰温度的提出背景和基本概念253.3.2 基于共享机制的认知无线电系统模型273.3.3 算法的博弈论建模283.3.4 纳什均衡求解和算法流程303.3.5 算法收敛性证明303.4 仿真实验及分析323.4.1 基于非共享机制的认知无线电系统功率控制算法323.4.2 基于共享机制的认知无线电系统功率控制算法383.5 本章小结414 基于实际吞吐量的认知无线电频谱分配策略434.1 问题描述434.2 系统模型434.2.1 基于ofdm技术的认知无线电系统434.2.2 通信模型444.3 基于实际吞吐量的频谱分配策略464.3.1 实际吞吐量464.3.2 传输时间损失率474.3.3 遗传算法求解484.4 仿真实验及分析494.5 本章小结505 认知无线电实验系统的闭环功率控制实现515.1 认知无线电实验系统概述515.2 闭环功率控制的原理525.3 闭环功率控制实现方案525.3.1 工作流程525.3.2 硬件系统及其接口535.3.3 帧结构设计及主要参数575.4 闭环功率控制的软件设计595.5 调试与实验结果625.5.1 射频调试结果625.5.2 闭环功率控制调试结果645.6 本章小结666 结论与展望676.1 论文总结676.2 下一步工作展望68致 谢70参考文献71攻读学位期间取得的研究成果74声明contentscontents1 preface1 1.1 topic significance and background1 1.2 definition of cognitive radio and status quo of research2 1.3 main work and structure of thesis32 game theory and its application in cognitive radio5 2.1 summarization of game theory5 2.1.1 definition of game theory5 2.1.2 models and categories of game theory6 2.1.3 analysis and solution of nash equilibrium7 2.2 application of game theory in cognitive radio10 2.2.1 interactions of cognitive radio10 2.2.2 application of game theory in cognitive radio11 2.2.3 modeling of power control based on game theory in cognitive radio12 2.3 brief summary133 power control algorithms based on game theory in cognitive radio14 3.1 current power control algorithms based on game theory14 3.1.1 sinr balance algorithm14 3.1.2 saraydar-mandayam algorithm15 3.1.3 koskie-gajic algorithm16 3.1.4 summarization of current algorithms17 3.2 power control algorithm in cognitive radio system of exclusive model17 3.2.1 cognitive radio system based on exclusive model17 3.2.2 modeling of power control algorithm based on game theory19 3.2.3 nash equilibrium solution and algorithm procedure22 3.2.4 proof of algorithm convergence24 3.3 power control algorithm in cognitive radio system of common model25 3.3.1 background and basic concepts of interference temperature25 3.3.2 cognitive radio system based on common model27 3.3.3 modeling of power control algorithm based on game theory28 3.3.4 nash equilibrium solution and algorithm procedure30 3.3.5 proof of algorithm convergence30 3.4 simulations and analysises32 3.4.1 power control algorithm in cognitive radio system of exclusive model32 3.4.2 power control algorithm in cognitive radio system of common model38 3.5 brief summary414 a spectrum allocation strategy based on goodput43 4.1 problem description43 4.2 system model43 4.2.1 cognitive radio systems based on ofdm43 4.2.2 communication models of licensed users and cognitive users44 4.3 a spectrum allocation strategy based on goodput46 4.3.1 goodput46 4.3.2 loss ratio of transmitting time47 4.3.3 solution of genetic algorithm48 4.4 simulations and analysises49 4.5 brief summary505 implementation of close loop power control in cognitive radio system51 5.1 summarization of cognitive radio experimental system51 5.2 principle of close loop power control52 5.3 implementation project of close loop power control52 5.3.1 work flow52 5.3.2 hardware system and interfaces53 5.3.3 design of frame structure and working parameters57 5.4 software design of close loop power control59 5.5 debugging and results of experimentation62 5.5.1 debugging and results of radio frequency62 5.5.2 debugging and results of close loop power control64 5.6 brief summary666 conclusions and suggestions67 6.1 conclusion67 6.2 expectation68acknowledgements70references71achievements74declaration在每一章的末尾插入下一章的mathtype的章标记(打印前将其字体颜色变为白色,在打印预览中看不见即可):1 绪论1 绪论1.1 选题背景及意义近年来,随着人们对无线通信业务需求的不断提高,各种无线通信技术得到前所未有的迅猛发展。在此过程中,无线频谱空间被划分给各种不同的通信技术使用,在大多数国家3ghz以下的频段几乎全部分配给了已授权的无线通信系统(或称为授权用户(licensed user)1。一方面,这种固定的频谱划分方式使得可用频谱资源变得越来越少。另一方面,已授权频带的不同频段频谱利用率相差悬殊,一些频段使用得非常频繁,而另一些频段大部分时间内却没有用户使用,整体上来看目前频谱利用率低下。美国联邦通信委员会(federal communications commission, fcc)的下属机构sptf(spectrum policy task force)的报告2表明,目前美国的无线频谱资源利用率一般介于15%到85%之间;另有文献表明34 ghz频带利用率只有0.5,45 ghz频带利用率下降到0.33。可以看出频谱资源的紧张的一个重要原因是当前的这种频谱分配和管理方式限制了已授权的空闲频段被非授权用户使用。为了解决这种效率低下的频谱管理方式与不断增长的频谱资源需求之间的矛盾,joseph mitola博士于1999年提出的认知无线电(cognitive radio, cr)的概念得到了学术界广泛的关注。他描述了认知无线电如何通过一种“无线电知识表示语言”(radio knowledge representation language, rkrl)的新语言提高个人无线业务的灵活性4。fcc于2003年12月发出以最佳方式实现认知无线电的提议5,6,结合软件定义无线电方法,以自适应、动态的方式实现多用户共享频谱资源的频谱管理和利用。由于认知无线电系统建立在对已授权频段利用的基础上,因此下列几个问题需要研究:如何保证授权用户不受认知无线电用户影响;如何保障认知无线电用户通信质量,提高认知无线电系统容量;如何合理利用有限的频谱资源,并对认知无线电用户功率进行有效控制。功率控制和频谱分配技术是无线资源管理(radio resource management, rrm)中的关键内容7。发射功率和频谱资源如果得到有效利用,就能够使认知用户对授权用户的干扰减小,同时使认知无线电系统的容量增加、通信质量改善。因此如何设计在各种工作机制下的功率控制算法,如何确定合理的频谱分配准则来优化系统性能,是认知无线电研究中的重要内容。当前,博弈论(game theory)应用于功率控制问题成为学者研究的热点。博弈论着重于紧缺资源的分布式求解,算法复杂度低,求解过程简单,所需全局信息较少,适合于应用到认知无线电系统中。同时,为了更好的验证认知无线电的功能,在已有的实验系统平台上实现功率控制功能是十分必要和有益的。这将为以后实验终端的组网和实现礼仪协议等功能打下扎实的基础。1.2 认知无线电的定义及研究现状1999年,mitola博士在他的文章8中首次指出认知无线电是“一种具有通过基于模型的推理来实现通信相关性能的能力的无线电设备”。随后在他的博士论文9中,提出了认知循环(cognition cycle,cc)的概念,并且对各模块的功能进行了详细分析。fcc在2002年成立了sptf小组专门研究提高频谱资源利用率的方法,给出了一个基于干扰温度(interference temperature)的认知无线电定义2。并从发射端具体操作的角度指出认知无线电是“一个能够通过与外部环境交互信息来调整自己通信参数的无线电设备”10。德国的fatih capar等人给出了一种比较简单,容易实现的认知无线电定义11,即认知无线电用户可以检测出某个频段的授权用户是否正在发射信号,如果有则认为有授权用户在使用该频段,如果没有则认为可以利用这个频段来传送信息。同时认知无线电用户还必须保证,在它使用授权频段的过程中,一旦发现授权用户重新开始工作,应能够立即停止对该频段的使用,对授权用户产生尽可能小的干扰。继mitola博士于1999年首先提出认知无线电的概念后,他以及其他组织和学者在认知无线电理论和技术方面不断取得新的成果。u. c. berkley大学的研究人员通过利用一些现有的软件无线电平台基本验证了由capar等人提出的简化的认知无线电定义。fcc于2004年5月开始考虑允许认知无线电可以在不对授权用户产生有害干扰的情况下使用电视频段12。ieee于2004年10月成立了802.22工作组开始着手研究和制定工作于电视频段的、基于认知无线电技术的无线局域网(wireless regional area network,wran)技术标准13。从2005年开始,认知无线电技术在世界范围内得到了广泛关注,目前已经能看到不少关于认知无线电关键技术的研究思路和成果。国家“十一五”863高技术研究发展计划申请项目指南中已经将认知无线电技术列为一项关键的研究领域。本文作者所在的课题组在863项目资助下,在认知无线电系统实验平台的设计与实现、礼仪与协议、授权用户检测等方面取得了一定的成果。随着软件无线电技术的发展,通过自适应调制的方式提高单个链路的性能取得了一定的研究成果。然而,由于认知无线电具有感知环境的能力,使得一条链路参数的改变将改变其他链路的用户正在感知的无线环境,有可能导致新的自适应调整发生,如此反复,网络内用户动态的调整和相互依存关系给认知无线电网络性能的分析带来了很大困难。james neel提出使用结合博弈论的方法来分析这一问题14,尤其在多个用户的功率控制问题上得到了很好的效果。起源于经济学的博弈论是一种对紧缺资源的系统分布式配置问题的求解方法。使用该理论分析通信网络的功率控制、频谱管理、拓扑结构生成等问题取得了丰富的研究成果15-24。近年来,众多学者在功率控制领域做出了许多成果。主要目的是减小共道干扰,保证用户的信干噪比(signal to interference plus noise ratio, sinr),从而使系统具有更高的信道利用率和服务质量(quality of service, qos)保障。以无线网络的功率控制为例。foschini和miljanic等人提出了基于信干噪比平衡的功率控制分布式算法,并讨论了其收敛条件15。famolari和mandayam提出了干扰方程(interference function)的概念,研究了功率控制迭代算法收敛的条件16。yates等人较早研究了在上行链路中影响功率控制问题的若干因素17。alpcan在功率控制中引入了支付函数,并提出了两种上行链路中的改进算法18。以美国伊利诺理工大学的david j. goodman教授为代表的国外学者和组织,自1998后相继发表了一系列文章19,20,23。saraydar和mandayam等人改进了用于多小区的分布式功率控制技术,提出了发射功率的“价格”概念,并将之作为一种影响用户传输数据行为的控制机制19。shah和saraydar等人在另外两篇文献中详细讨论了基于效用函数(utility function)和价格函数(price funciton)的功率控制机制,并谈到了关于帕累托改进(pareto improvement)的问题20,23。koskie和gajic在引入价格函数的基础上对信干噪比平衡算法进行了改进,在牺牲很小的信干噪比损失的前提下大幅降低了发射功率24。此外,一些学者将博弈论应用于功率与传输速率联合控制、功率控制与频谱接入、功率控制与波束成形,功率控制与网络拓扑结构生成等相结合,取得了宝贵的成果25-28。认知无线电中的频谱分配是指根据需要接入系统的认知无线电用户数目及其服务要求将频谱分配给一个或多个指定用户。频谱分配策略的选择直接决定系统容量、频谱利用率以及能否满足用户因不同业务而不断变化的需求。德国karlsruhe大学fiedrich jondral教授提出了频谱共享池(spectrum pooling)模型29。美国国防高级研究计划局启动了下一代xg计划(next generation, xg),其中实现灵活的频谱分配是该计划的主要目标之一。国内外学者在具体的频谱分配算法方面取得了一些成果30-32。但在如何确定占用的信道数方面研究较少。本论文将对这一频谱分配策略展开研究。1.3 论文完成工作与结构安排在国家高技术研究发展计划(“863”计划)基金资助下,本文作者参与了“认知无线电系统关键技术(2005aa123910)”项目的研究工作。主要完成的工作如下:1)提出认知无线电系统的参数调整过程实质是一个交互式决策过程。该过程可通过非合作博弈方法求解。并由此建立了认知无线电系统的功率控制博弈论模型。2)针对基于非共享机制的认知无线电系统,根据认知无线电用户对信干噪比的满意度特点,提出了一种新的效用函数。设计了一种基于非合作博弈的功率控制算法并证明其收敛性。证明了该博弈中纳什均衡解的存在性和唯一性。通过仿真验证了算法的收敛性和稳定性,讨论了各个参数对算法性能的影响,并与其他算法的性能进行了比较。3)在以上工作的基础上,针对基于共享机制的认知无线电系统,改进了效用函数,引入了基于指数惩罚系数的价格函数,设计了新的基于非合作博弈功率控制算法并证明其收敛性。通过仿真验证了该算法收敛性、稳定性和对授权用户的有效保护。4)提出了一种认知无线电频谱分配策略。推导了实际吞吐量的数学表达式,并分析了物理概念。设计了基于遗传算法的最优策略求解方法。通过仿真验证了实际吞吐量与所分配子信道数的关系和最优策略求解方法的有效性。5)负责了认知无线电硬件实验系统射频发射、接收模块的实现与调试,并与基带和中频模块实现了成功对接。在射频联调成功基础上,设计实现了认知无线电实验系统的闭环功率控制方案。本论文的结构安排如下:第一章,绪论。本章介绍了选题的背景和意义,认知无线电技术的定义与研究现状,论文完成的主要工作和论文结构安排。第二章,博弈论及其在认知无线电中的应用。本章介绍了博弈论的基本概念、基本模型、分类和求解方法,分析了认知无线电的交互作用和博弈论在其中的应用,建立了认知无线电功率控制算法的博弈模型。第三章,基于博弈论的认知无线电功率控制算法。本章首先介绍了已有的功率控制博弈算法。分别针对基于非共享机制和共享机制的认知无线电系统,提出了新的效用函数模型,设计了新的功率控制博弈算法,对算法收敛性给出了证明。最后对两种新算法给出了仿真结果和分析。验证了算法收敛性,分析了关键参数对算法性能的影响,并与已有算法的性能进行了比较。第四章,基于实际吞吐量的认知无线电频谱分配策略。本章首先提出了采用ofdm技术的认知无线电系统最优占用信道数的策略选择问题。推导了实际吞吐量的概念,设计了策略选择算法。最后通过仿真验证了实际吞吐量与分配信道数的关系和策略选择算法的有效性。第五章,认知无线电实验系统的闭环功率控制实现。本章首先简要介绍了实验系统的基本情况和闭环功率控制的原理。接着给出了闭环功率控制的实现方案和各个模块的软件设计流程。最后在实验系统上予以实现。第六章,结论与展望。总结论文完成的工作和主要创新点,指出存在的问题以及以后的研究方向。6 结论与展望2 博弈论及其在认知无线电中的应用2.1 博弈论概述2.1.1 博弈论的定义在人类的生活生产活动中,经常需要针对不同问题研究对策。然而某些问题的决策不仅决定于可选对策对决策人带来的收益,也决定于此决策对其他竟争对手产生的影响,这种时候决策者往往处于进退两难的境地。博弈论在这样的背景下应运而生。博弈论,也称对策论,是研究决策主体的行为发生直接相互作用时候的决策以及这种决策的均衡问题。当一个主体的决策受到其他人决策的影响,而且又反过来影响其他人的决策时,这种决策和均衡问题就需要用博弈论的方法来解决33。众多学者给博弈论下的定义也不尽相同,比如:1)博弈论提供了一种在相互作用的决策条件下建模和分析的框架及语言,该决策条件是指有着(部分)相互冲突目标的多个决策者互相产生影响34。2)博弈论是研究博弈情景下博弈参与者的理性行为选择的理论;或者说,是关于竞争者如何根据环境和竞争对手的情况变化,采取最优策略和行为的理论35。3)博弈论是一个分析工具包,它被设计用来帮助我们理解所观察到的决策主体相互作用的现象36。尽管关于博弈论的定义在描述上有些许区别,但其本质意义是一致的,即博弈论是在决策者具有相互冲突目标或交互作用条件下的一种策略选择理论。博弈论与常规的优化决策理论的不同之处在于:博弈论中参与者在利益上有冲突;参与者要各自做出优化决策,并企图使个人的利益最大化;每个人的决策和他人之间有相互作用,即他人的决策会影响某个人,而某个人的决策也会影响他人;在博弈论中一般假定参与决策的个体均为“理性的(rational)”,从而进行理智的逻辑思维。博弈论中的所谓“理性”,一般不是指道德标准。以博弈的参与者的眼光来看,他们试图去实施自己认为可能是最好的行为,尽管这种行为有可能损害了其他的参与者。因此“理性行为”似乎有点“利己”,而“不管是否损人”。由于参与者的相互依存性,博弈中一个理性的决策必定建立在预测其他参与者的反应之上。这意味着参与者应该清楚地知道自己的目标和利益,在博弈中针对其他参与者的策略尽可能地选择能使自己收益最大化的策略。这样,博弈中任何一个参与者的决策不仅会影响其他参与者的选择,也会影响博弈最终的结果。我国古代著名的“田忌赛马”可以看作是最早的博弈论应用案例。大多数学者认为,博弈理论始于1944年冯.诺依曼(john von neumann)和经济学家摩根斯坦(oskar morgenstern)合作的博弈论与经济行为(the theory games and economic behavior)一书。在上个世纪50年代,纳什(nash)为非合作博弈的一般理论奠定了基础,他提出了博弈论中最重要的概念纳什均衡(nash equilibrium),开辟了博弈论的一个全新领域。他规定了非合作博弈的形式,定义了著名的“纳什均衡点”37。此后四十余年里,大量学者致力于发展“纳什均衡点”理论,探讨其实际应用的可能性。到了20世纪80年代后期,博弈论进入繁荣时期,产生了许多研究成果,博弈论的应用范围也不只是经济学的一个分支,而成为一种方法论,在各个领域都得到了广泛应用。2.1.2 博弈论的基本模型及分类博弈论自产生到发展至今已形成了较成熟的理论体系,它具有其自身的基本模型。一个完整的博弈过程用以下5个方面来描述:。1):参与者在英文中译为player,也可称为博弈方,是参与博弈的直接当事人,是博弈的决策主体和策略制定者。其中,表示该博弈中有个参与者。在不同的博弈中参与者的含义是不同的,既可以是个人也可以是团体或者集团,关键在于这些参与者是为了一个共同的目标和利益参与博弈的。2):博弈策略在英文中译为action,参与者可选择的全部行为或策略的集合。即规定每个参与者在进行决策时(同时或先后,一次或多次)可以选择的方法、做法或经济活动的水平、量值等。它是参与者进行博弈的工具和手段,每个策略集合至少应该有两个不同的策略。所有参与者策略集合的笛卡尔积构成了博弈的策略空间,其中,表示参与者可以选择的策略集合。3):博弈次序在英文中译为strategy。在现实的各种决策活动中,当存在多个独立参与者进行决策时,有时候这些参与者必须同时做出选择,因为这样能保证公平合理。而很多时候各参与者的决策又必须有先后之分,并且在一些博弈中每个参与者还要作不止一次的决策选择,这就产生了一个次序问题。因此规定一个博弈就必须规定其中的次序。4):博弈信息在英文中译为information。信息对于博弈参与者至关重要,掌握信息的多少将直接影响到决策的准确性,从而关系到整个博弈的成败。有经验的参与者尽可能多地收集博弈信息,力争在选取策略和进行决策时掌握主动。5):参与者效用在英文中译为utility。也可称为参与者收益。是指参与者从博弈中付出的代价或得到的收益,它是所有参与者策略的函数,因此也可以称为效用函数。可用公式表示为:。对应于各参与者的每一组可能的决策选择,博弈都有一个结果表示各参与者在该策略组合下的得与失。这就是效用函数。对于每一个参与者,效用函数的结构与取值将会影响到参与者的行为,因而也影响到了博弈的最终结局。由此可知,效用函数的确定在博弈论研究中非常重要。从博弈的不同角度和参与者的不同观点出发,可以产生许多形形色色的效用函数,并不唯一。博弈论就是系统研究用上述方法定义的各种各样的博弈问题,寻求各博弈方合理选择策略情况下博弈的解,也就是均衡(equilibrium)。其中最基本的三个元素是参与者、博弈策略和效用。现实中各种博弈可以从不同的角度进行分类。根据参与人的多少,可以将博弈分为两人博弈和多人博弈;根据参与人是否合作,可以将博弈分为合作博弈(cooperative game)和非合作博弈(non-cooperative game);根据博弈的结果,又可以将博弈分为零和博弈,常和博弈和变和博弈。在非合作博弈中,现在最流行也最有用的分类方法是从博弈参与人的行动次序和在博弈中所获信息的差异角度来分,具体为:从决策的先后次序来分,博弈可以分为静态博弈和动态博弈;从参与人各种博弈信息的获得差异来分,博弈可以分为完全信息博弈和不完全信息博弈。静态博弈指的是博弈中参与者同时做决策,或虽非同时但后做决策者并不知道前面的决策者采取的具体策略;动态博弈指的是:参与者的决策过程有先后顺序,且后决策者能够观察到先决策者所选择的策略。完全信息指的是每一个参与者对其他参与者的特征、策略空间及效用函数有准确的认识;否则,就是不完全信息。2.1.3 纳什均衡的分析和求解均衡是一个博弈过程的最终稳定状态。在均衡点上,每个参与者都不会主动改变自己的策略。前面已经讲到非合作博弈可从两个角度分成四类,而这四类博弈对应者各自不同的均衡点。如表21所示。表21 非合作博弈的分类及对应的均衡概念博弈行动顺序静态动态完全信息完全信息静态博弈纳什均衡完全信息动态博弈子博弈精炼纳什均衡不完全信息不完全信息静态博弈贝叶斯纳什均衡不完全信息动态博弈精炼贝叶斯纳什均衡在这里,我们重点分析非合作博弈中的完全信息静态博弈及纳什均衡。非合作博弈强调的是个体理性、个体最优决策,每个用户的选择策略的原则是最大化自己的效用,即:式中:参与者在一次博弈中所选择的策略;除了参与者以外的其余个参与者在该次博弈中的策略矢量;参与者的策略集合;参与者的效用函数;本次博弈的参与者集合。纳什均衡就是各个参与者在非合作博弈过程中达到的稳定状态。下面给出纳什均衡的数学定义37:定义2-1:如果一个博弈过程,对有:式中:参与者在纳什均衡点处选择的策略,那么这个策略是博弈的纳什均衡点。对于非合作博弈中的每一个参与者,真正成功的措施应该是:针对其他参与者所采取的决策,相应地采取最有利于自己的策略。或者说,对于对手的每一决策做出最有利于自己的反应。因此,如果存在这样一种策略组合,为了极大化自己的收益,每一个参与者所采取的策略是其对手所采取策略的最佳对应反应,即没有一个博弈参与者会轻率地偏离这个策略组合而使自己蒙受损失,则博弈存在纳什均衡点,该组策略为纳什均衡策略。针对上面的分析,给出纳什均衡的第二个定义:定义2-2:在集合上的连续函数的最优策略集合称为的最佳对应反应(best response

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论