版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、基于主体的区域创新系统演化模型研究1佘震宇 赵黎明 韩宇(天津大学管理学院,300072摘要 构造了区域创新柔性主体、半柔性主体和刚性主体的数学模型,构建了基于主体的区域创新复杂系统模型以及各微观主体相互学习和演进的系统模型,描述了区域创新复杂系统的演化过程。关键词 区域创新 柔性主体 半柔性主体 刚性主体 多主体模型区域创新系统的协调发展,是一个涉及到方方面面的系统工程。从演化的角度来看,区域创新系统的发展就是通过各级有活力、主动性的个体不停交互、共同学习而推动前进的。区域创新过程是一个渐进的、演化的过程,是区域系统各种资源协调配置共同作用的动态过程;其演化的过程就是区域创新主体通过自己与其
2、它主体、与环境的交互作用,不断适应,不断提高的过程。区域创新系统是由许许多多具有主动性和自治性的微观主体组成的。这些微观主体能够主动探测周围政治、经济、生态环境和与之相关的其它微观主体的变化,检测自身内部状态、结构、行为方式;根据自身偏好和目标,以及所收集到的环境信息,对外界变化做出适应性调整并对环境产生相应影响。区域创新系统的基本组元有三种:区域创新柔性主体对外界环境变化反应迅速,其行为是典型的刺激-反应类型,不需要过多的规划和推理。其结构可以描述为一个八元组2,3,4,5:action ,next ,see ,A ,I ,P ,goal ,id .Eangent r r r .r =。其中
3、:表示区域创新柔性主体;id 为该区域创新主体与其他区域创新主体区分的标识;goal 表示区域创新柔性主体的目标;表示区域创新柔性主体的视觉状态集;表示区域创新柔性主体的内部状态集;表示区域创新柔性主体的反应序列集;see ,next 和action 用于刻画区域创新柔性主体内部对外界刺激的反应过程,具体表示为下面几个映射,区域创新半柔性经济主体是介于柔性经济主体与刚性经济主体之间的一类微观主体。其结构可以1教育部博士点基金资助项目,项目批准号:20020056050表示为一个十三元组。action ,estimate ,next ,judge ,see ,R ,D ,D ,R ,A ,P ,
4、goal ,id .Eangent ule ar va b b .b =其中:表示区域创新半柔性主体;id 为该主体与其他主体区分的标识;goal 表示区域创新半柔性主体的目标;表示区域创新半柔性主体的视觉状态集,表示某外部状态s 经过区域创新半柔性主体感知后在其内部形成的视觉映像; 、R 、Dva 、Dar 、Rule 、next 、estimate 、action 的具体含义则与judge 对视觉映像的判断结果有关:b Eagent b P P p (p b b b b A 1.如果judge 判断该视觉映像为“普通”,即需要区域创新半柔性主体做出日常行为的决策,则、next 、actio
5、n 的含义等同于柔性经济主体中、next 、action 的含义;R 、Dva 、Dar 、Rule 为空集合,estimate 不起作用。此时区域创新半柔性主体的作用过程也类似于柔性主体的作用过程;b A r A 2.如果judge 判断该视觉映像为“战略”,即需要区域创新半柔性主体做出战略决策,则、R 、Dva 、Dar 、Rule 、next 、estimate 、action 的含义等同于刚性经济主体中、R 、Dva 、Dar 、Rule 、next 、estimate 、action 的含义。此时区域创新半柔性主体的作用过程也类似于刚性主体的作用过程。区域创新刚性主体行动决策的做出需
6、要掌握充分的信息并进行规划、推理、甚至预测。其结构可以描述为一个十二元组 4,5,6,7:action ,estimate ,next ,see ,R ,D ,D ,R ,A ,P ,goal ,id .Eangent ule ar va g g .g =。 其中:表示区域创新刚性主体;id 为该区域创新主体与其他区域创新主体区分的标识;goal表示区域创新刚性主体的目标;表示区域创新刚性主体的视觉状态集;表示区域创新刚性主体的行为集;R 表示区域创新刚性主体所有可能的结果状态所构成的集合;R g Eagent g P g A ule 为具体的决策法则构成的集合;D va 表示视觉状态与方案集
7、的对应规则集;D ar 表示方案集与结果状态集之间的对应关系;区域创新刚性主体的内部行为可以表示为下列映射:,g P S :see A (P :next g ,R (A (:estimate A R (A (:action 。2.2.1角色8,9,10角色是区域创新系统中具有特定社会功能,拥有特定权利与责任群体组织中的“位置”。每个角色都至少有责任、权利和协议这三个属性。某个角色可以由某个或者某几个区域创新微观主体担任;而区域创新系统就是由担任不同角色微观主体组成的社会型组织。区域创新系统的系统结构有集中控制型、网络型和联盟型三种形式。区域创新系统的系统结构可以用一个四元组来表示10:GOAL
8、 _O ,RELATION ,ROLE ,ID _OS .OS =其中:OS 表示区域创新系统的系统结构;OS_ID 是该系统结构的标识,用来区分不同的系统结构;ROLE 是一个非空的集合,由该系统结构的角色组成;RELATION 是对该系统结构角色之间关系描述的集合,可以是一个空集;O_GOAL 表示该系统结构的系统目标,是一个非空集合。区域创新系统是由多个微观主体按照系统结构建立起来的社会型群体。可以描述为一个五元组12:EVENT ,MAP ,OS ,EAGENTS ,ID _O .O =其中:O 表示区域创新系统;O_ID 是该区域创新系统的标识,用以和其他系统相区别;EANENTS
9、是组成该系统的区域创新微观主体集合,是一个非空集合;OS 是该系统所采取的特定系统结构;MAP 表示系统成员与系统结构中角色的对应关系;EVENT 表示系统目前正在处理的事务集合,它可以是一个空集。区域创新系统的形成是多个区域创新微观主体协商的过程。例如,由政府担任区域创新系统的管理者,政府作为委托方,其他区域创新微观主体作为采纳方,协商结果是政府和其他区域创新微观主体之间建立起社会承诺,协商过程就是社会承诺的建立过程:系统管理者选择自己在区域创新过程中可以承担的角色,完成MAP 的修正;系统管理者根据目前的系统情况,确定招聘角色集合(招聘角色是系统希望其他区域创新微观主体承担的角色,并通知其
10、他区域创新微观主体;其他区域创新微观主体根据招聘信息,确定期望角色(期望角色是其他区域创新微观主体希望在系统中承担的角色,通知管理者。如果一个角色所需要的能力集合是某区域创新微观主体能力集合的子集,那么该主体可以承担这个角色, 记为can (eagent,role ;如果一个角色的目标符合某区域创新微观主体的个体倾向,那么该主体愿意承担这个角色, 记为like (eagent,role ;如果一个角色的收益大于某区域创新微观主体完成该角色的代价,则该主体偏好承担这个角色,记为prefer (eagnet,role 。这样,当一个区域创新微观主体收到招聘角色信息时,则会根据该角色依次判断can
11、(eagent,role ,like (eagent,role ,prefer (eagent,role 。当一个区域创新微观主体收到多个招聘角色信息时,则会根据计算出来的各个角色的can (eagent,role ,like (eagent,role ,prefer (eagent,role 进行判断和选择。系统管理者根据其他区域创新微观主体发出来的信息,决定将系统结构中的角色委托给哪位区域创新微观主体担任,并通知该主体。如果某个招聘角色没有期望者时,管理者需要对系统结构进行适当调整;其他区域创新微观主体根据管理者的反馈信息,对自己进行相应的调整和处理,以适应多主体模型系统对该角色的要求。区
12、域创新系统的演化通过微观主体自身的进化以及多主体之间的交互来实现。3.1.1区域创新系统微观主体新规则的产生11,12区域创新系统微观主体的规则是指各种类型微观主体根据外部环境变化调整自己行为的备选方案;这种备选方案可以是信息处理方式、具体的行动、行动选择方式等。微观主体的行动调整过程就是在备选方案集合中选择最适合方案的过程。微观主体的进化就是这些规则不断根据环境进行调整的过程,也是微观主体对环境的不断适应过程,具体表现为规则适应值的调整过程。为了实现计算机的模拟,我们往往把规则表述成为一系列二进制的字符串。新规则的产生,来源于区域创新微观主体已有的经验。那些已经被区域创新微观主体大量引用并检
13、查过的规则,可以作为新规则产生的积木(即组成部件。新规则的产生有选择、交叉和突变三种方式,在计算机上可以用遗传算法进行实现。微观主体适应值是用来刻画微观主体规则对环境和其他主体刺激适应程度的数量单位。适应值大的规则对环境的适应程度就越高,在受到外界刺激时被激活的可能性越大。微观主体的所有规则在受到外界刺激时都可以参与竞争,具体是哪一条规则获得行动的权力则取决于该规则适应值的大小。一条规则的适应值越大,其获得支配微观主体行动的可能性就越大。微观主体适应值的调整可以用“传递水桶”算法来描述:假设某条规则被激活,它在起作用之前必须将其适应值的一部分转移到激活它的规则的适应值上作为被激活的补偿。而它在
14、起作用之后收取其激活的规则(或者是环境反馈而来支付的适应值。这样的过程依次发生,从而完成了规则适应值的分配与修改。该过程用数学语言描述如下13,14:设某一个竞争过程有rule 1, rule 2, rule n 等n 条规则参与,每条规则的适应值分别为fitness 1, fitness 2, fitness n 。rule i 是其中的一条规则,适应值为fitness i ,则其被选中的概率为:=n i i ii fitnessfitness rule ob 1(Pr 如果它被选中,则其适应值可以这样计算:(cos (1(t reward t t t fitness t fitness i
15、 i i i +=+式中,fitness i (t+1表示该规则在t+1时刻的适应值;fitness i (t 表示该规则在t 时刻的适应值;cost i (t 表示在t 时刻该规则竞价中标时的支出;reward i (t 表示t 时刻该规则进行消息发送所得到的回报。3.2区域创新微观主体的交互学习15,16,17区域创新是一个动态的、渐进的演化过程。在演化的过程中,各级行为主体都要根据新出现的情况和信息调整自己的行为和结构。在系统演化过程中,政府在每一个发展阶段结束后都要根据现有的发展状况,新出现的机会和挑战制订下一阶段的发展方向和目标。其他微观主体也要进行如此的学习过程。区域创新微观主体强
16、化学习的结构,如图1所示。 区域创新微观主体的强化学习分为三个部分:输入模块、强化模块和策略模块。输入模块把环境信息转化为区域创新微观主体的输入信息传入策略模块;强化模块把环境的状态转化为强化信号输入到策略模块中;策略模块更新区域创新微观主体的知识,同时使区域创新微观主体根据某种策略选择一个动作并作用于环境。在区域创新多主体模型中,比较合理的微观主体学习模型是将多种学习算法、知识表示和反馈机制集成在一起,形成多策略学习方法。同时,微观主体应该通过观察周围动态变化的环境,形成假设,并在碰到新的情形时根据环境的反馈信息自主进行假设检验和验证,以增强微观主体的环境适应能力,即能自主学习。区域创新微观
17、主体基于进化策略的多策略自适应学习模型的目的在于:通过多策略自适应学习,微观主体学会如何应付各种情形,根据不同情形,选择不同学习策略,从而学会如何学习。通过多策略自适应学习,一个微观主体就会根据其具体的动作环境选择合适的学习方式,以尽快的获取必需的知识,产生动作,完成任务。但其中还需要微观主体具有能够识别何时知识不够需要学习的判断能力。另外,为了更好的向其他微观主体学习,每个微观主体都应该建立一个“微观主体关系网”。“微观主体关系网”是指能够帮助一个微观主体解决问题并从中获利的微观主体群体。在“微观主体关系网”中,可有来自于其他微观主体联邦的微观主体。这些微观主体之间互利互惠,共同演化。区域创
18、新复杂系统的演化是由系统内部各种类型的微观主体自身演进以及其与环境交互和相互学习进化推动的。本文的研究为定量研究区域创新复杂系统的演化提供了系统模型的支持。参考文献1 刘和平,魏一鸣等,复杂性科学及其在经济领域中的应用J,中国管理科学,2000,8(专辑:248-2572 华立,赵纯均,复杂性与社会经济系统建模J,清华大学学报(哲学社会科学版,2001,16(3:43-483 任锦鸾,顾培亮,基于复杂理论的创新系统研究J,科学学研究,2002,20(4:437-4404 Axelord R M,The complexity of cooperation:agent-based models o
19、f competition andcollaborationM,Princeton Univ. Press,19975 黄小兵,唐文胜,基于Agent系统的概念、方法和应用J,计算机与现代化,2000,68(4:6-116 陈禹,复杂适应系统(CAS理论及其应用由来、内容与启示J,系统辩证学学报,2001,9(4:35-397 王君,樊治平,一种基于Multi-Agent的区域创新模型框架J,东北大学学报,2003,24(1:94-978 Robert E S,Warmuth K.,On the worst-case analysis of temporal-difference learni
20、ngalgorithmsJ,Machine Learning,1996,22:95-121 9 惠龙,覃正,张焊霞,一种基于过程的动态联盟技术创新系统组织结构与决策机制J,科学管 理研究,2004,22(2:14-17 10俞星星,阎平凡,强化学习系统及其基于可靠度最优化的学习算法J,信息与控制,1997,26 (1) :332-339 11Tesauro G J,Temporal difference learning and TD-gammonJ,Communications of the ACM, 1995,38(3) :58-68 12Pushkar P , Abdul S , Rei
21、nforcement learning of iterative behavior with multiple sensorsJ,Journal of Applied Intelligence,1994,4(5) ,365-381 13邓宏钟,王军民,谭跃进,基于多智能体的整体建模仿真方法在经济系统中的应用研究J,计 算机应用研究,2001(10) :24-26 14高波,费奇,陈学广,思考型 Agent 的基本结构J,华中科技大学学报,2001,29(2) :25-27 15马光伟,徐晋晖,石纯一,Agent 思维状态模型J,软件学报,1999,10(4) :342-348 16刘弘,曾广周,林宗楷,
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 装修施工合同样本2023
- 玻璃幕墙劳务施工合同
- 文旅局疫情防控应急演练
- 工业用地交易补充协议样本
- 体育健身技术员录用合同样本
- 餐饮连锁PVC地板安装合同
- 货运公司防火门施工合同
- 会计师事务所劳动合同样本
- 常州教育培训机构租赁合同
- 园林绿化模板施工承包合同
- 2023年天津公务员已出天津公务员考试真题
- 2025年高考数学专项题型点拨训练之初等数论
- 上海市浦东新区2024-2025学年六年级上学期11月期中数学试题(无答案)
- 教科版三年级科学上册《第1单元第1课时 水到哪里去了》教学课件
- 通信技术工程师招聘笔试题与参考答案(某世界500强集团)2024年
- 国际贸易术语2020
- 国网新安规培训考试题及答案
- 2024至2030年中国节流孔板组数据监测研究报告
- 黑龙江省哈尔滨市师大附中2024-2025学年高一上学期10月阶段性考试英语试题含答案
- 第六单元测试卷-2024-2025学年统编版语文三年级上册
- 【课件】Unit4+Section+B+(Project)课件人教版(2024)七年级英语上册
评论
0/150
提交评论