版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、双结构互联网中国工程物理研究院李幼平 2005.11.21于中国复杂系统论坛万维网是复杂网络67.8万个网站(存储节点)与1亿网民(生理节点)互动,形成万维网的复杂性无尺度的物理基础:存储器一次写入,可多次读出,读出次数没有上限小世界的生理基础:人类注意力资源的有限性某种意义上,因为存在“小世界”,所以出现“无尺度”;同一复杂事物的两个简单的侧面网站度值幂律分布,网民度值随机分布创意的由来摩尔定律下无限的物理比特,与DNA制约下人类只能接受有限的生理(熵)比特,产生了冲突,揭示了矛盾揭示TCP/IP结构“用户规模不能自由增长”,揭示广播结构“内容规模不能自由增长”在TCP/IP互联结构基础上,
2、增添一种“播存结构”,让更多人群自由选择更有用的内容科学发展观要求人类与大自然和谐相处,我们希望网络与人类的文化活动和谐相处用PPT表达创意的由来CN Internet 一亿网民CN Web 66万网站CN Core 1000网站CN Core 1000网站CN NGI 5亿网民主结构Primary次结构Secondary和谐整合电信与广播当前的互联网,物理层是构建在电信网双向连接之上的,无缘于单向的广播网次结构:广播分流最活跃的热门网页,使“平均距离”大幅降低克服“数字鸿沟,实现“数字文化村村有”主结构将缓解拥堵,显得格外通畅为实现“网页主动寻找网民”的“语义网”理想提供物理基础向理论家请教
3、2005年10月9日,我向汪秉宏老师请教:1,请用复杂网络理论描述中国现有的万维网(尽量采用科学院中国互联网信息中心CNNIC的最新统计数据)。2,请沿用用CNNIC“前一百”的提法,在现有67万提供内容的网站中,分离出“前100”、“前500”、“前1000”、“前3330”“前xx”,形成“主流网站”3,假设,有人想出办法(如播存结构),有能力把“前xx”主流网站的访问距离(或跳数)统统变为1,试问:中国万维网的的理论图象会发生什么变化?有中心?无中心?在拓扑图中,互联网是一片“云”;从技术上看,各节点完全平等,无主次,无中心,无结构可是统计结果却是有主次,有中心,有结构为什么?网络专家忽
4、略了人文活动对网络的反作用,古语云:“不知卢山真面目,只缘身在此山中”其实,CNNIC早就有察觉,只是没有抽象化、形式化,提高到数学高度去认识CNNIC的“前一百个”2005.7.11CNNIC王恩海告诉我:网站拥有字节量”比例悬殊,前一百家(占网站总数万分之1.7)占字节总数13.3%网站总数595550个,前一百家平均拥有34.3万个网页,而所有网站平均只有523.7个网页,相差近千倍就在一百家内部也拥有极大差异怎么说是没有中心呢?网站链接情况(摘自2003年中国互联网络信息资源数量调查报告 )没有连接:占41%连接1-5家:占29.9%连接5-10家:占15.0%连接11-20家:占7.
5、4%连接21-50家:占3.6%连接51家以上:占2.7%绝大多数网站,连接数很少(97%网站少于50家),只有极少数网站才拥有极大的连接数用Scale-free定律 拟合请参见马卫东的报告:中国互联网资源幂次分布分析结论:中国互联网也是无尺度网络中国互联网也是无尺度网络,幂数为2.12467.8万个网站,被访问量差异极大,社会地位(Google称为rank)差异极大前100个,前500个,前1000个,或前2000个是中心,是主流互联网的流量,相当大的比例,源于这些网站启示:打造国家级群体 无尺度现象启示我们打造国家级文化群体的灵感 只要把几千个甚至几百网站整合起来,就可以形成满足社会上绝大
6、多数人群需求的“普适化”pervasive主流媒体 如果技术上想出办法,能让主流群体普及下去,普及到每个村庄或家庭,就可以在普及数字文化的进程中实现历史性跨跃。互联网有一个“芯”(core)?Web是Internet的中心,网上流动着网页,多是源自Web1000-3000个网站又是Web的芯(core),多数流动着的网页源于这些网站这些网站也是互联网的“芯”这个“芯”就是主流文化群体,也许,其中包括300种报纸、500种网站、800种期刊、上千种课程这个“芯”引发我们创新的灵感营造Scale-free的共享环境次结构,播存结构,用户数目可以无上限自由增长,不受带宽限制对应物理上的辐射,点对面,
7、各向同性不是对流,不是点对点,不是公路,是阳光我国人口众多,我们致力于寻找一种网民数目可以无上限增长的共享结构参见中国工程科学两篇文章:信息阳光-无冲突共享结构(2000.2,p24-27);共享信息的第二类网络(2002.8,p8-11)营造Small-world的服务环境连接主结构与次结构的透明计算透明:按需取用,不必顾及具体来历融合两种信道:大量文件下载,依靠单向广播与存储的次结构;双向互联,仍然依靠主结构复杂问题简单解决:最常用的,放在最近!服务将是低成本的,主动的,惠及全民的分布全国、无所不在的普适计算:Pervasive computing主结构Primary次结构Secondar
8、y互联结构播存结构用户规模受限Scale-limited用户规模不限Scale-free内容规模不限内容规模受限提供全面服务文化共享服务信息公路信息阳光被动待取主动到家复杂路由,URL网址定位免路由,UCL内容定位主次结构和谐整合什么是下一代互联网(NGI)?主流派的回答是:IPV6加光纤到户我们补充说:应该添上播存结构电信业接入的主结构,同广播业接入的次结构,通过透明计算和谐整合请理论家计算平均距离、度值分布、集聚系数会有什么变化恭请诸位评论“双结构互联网”的前景 谢 谢 ! 李幼平 liyp 双结构互联网定量分析Internet与WWW的业务与大尺度模型模型定参与算法描述部分仿真结果 任
9、勇清华大学电子工程系复杂工程系统实验室(CESL)国家自然科学基金-网络与信息安全重大研究计划项目:(1)复杂互联网络整体动力学理论、方法与应用(No.90204004)(2)互联网络业务源模型与业务量预测(No.90304005)Internet的物理模型ASASASPublic exchange pointPrivate peeringHosts/EndsystemsAccess networksStub DomainTransit DomainsBorder routersRoutersInternet 中大约存在近 15,000个自治域 (ASes)Internet与WWW的业务与大尺
10、度模型WWW的物理拓扑在Internet中的位置InternetInternet接入网Border routersInternet中心RoutersWorld-Wide WebInternet与WWW的业务与大尺度模型用户子网WWW的逻辑拓扑Internet与WWW的业务与大尺度模型Internet核心及接入World-Wide WebASRouters用户URL: URL: URL: Internet业务种类弹性数据业务实时业务:VoNVoice and Video over the Net流媒体业务承载其它网络接入业务无线网实时业务接入无线网数据业务接入IPv6所能解决的本质问题只有一个:
11、地址空间Internet作为生长型网络,永远无法满足带宽需求WWW业务特征文件传输为主Poisson到达:负指数分布文件长度服从重拖尾分布:Bounded Pareto网站文件服务时间也服从重尾的BP分布重尾业务:持续时间具有重拖尾分布特性的业务重拖尾业务实质:被长流调制的慢变的布朗运动 用户满意度指标:阻塞概率、平均响应时间播存结构理论分析:有限忍耐度的排队系统分析文件长度服从BP分布(Bounded Pareto)k = 1.22 kbyte, p = 1 Mbyte, = 1.1文件长度均值6.56 kbyte,方差7.17108 大于100kbyte的文件占0.72%大文件产生的数据量
12、占27.1%文件长度服从负指数分布,则大于100kbyte的文件占2.4/千万,数据量占3.7/百万。 M/ G/ 1、 M/ G/ 、 M/ M / c可解析。M/ G/ c无法直接分析,没有分析工具!重尾业务特点及其处理方法大方差(LV): 2 时无穷大方差,尾分布部分截断(比如BP),方差仍然特别大重拖尾(HTD):尾分布业务在总流量中占相当大的比例,即小概率事件产生较大影响(流量)长相关(LRD) :持续时间服从重拖尾分布的ON/OFF 过程通常表现出长相关的特征重尾业务处理方法分解:长短流分解:Xd= DC,最大忍耐时间处理吞吐量持续时间分解:45%流15分钟,却占50%突发性分解:
13、-分解,Agg+ 3Aggstd 临界速率 Elephant and Mice ! Dragon flies and Tortoises!仿真网络系统模型N1 核心网N2 接入网N3 WWW网N4 用户子网N3 依实测WWW数据复现N1-N3 依实测Internet 数据复现N4 实现事件触发 模型定参与算法描述1、用Transit-stub模型生成Internet物理拓扑N1-N2;2、依照CNNIC数据,用可调幂指数BA模型生成WWW逻辑拓扑N3;3、依照CNNIC数据(用户兴趣统计),生成业务触发节点N4;4、改变了WWW逻辑拓扑,改变了N4节点访问TOP n% N3节点的路由,实现核心
14、节点播存。5、统计Internet流量变化:负载等网参变化与性能评估。N1=N2=5000, N3=2500, N4=2000N1 核心网N2 接入网N3 WWW网N4 用户子网 核心内容用于播存*CNNIC2003年中国互联网络信息资源数量调查报告Internet节点度分布WWW节点度分布网络流量分布对比网络平均流量变化骨干链路流量变化节点负载分布对比平均节点负载变化骨干节点负载变化与其它共享技术对比Internet的节点度分布*数据来源:软件学报2005,16(5):847-856 结果WWW的节点度分布* 结果*数据来源:CNNIC2003年中国互联网络信息资源数量调查报告播存前后Int
15、ernet网络流量分布对比 结果播存的核心节点数量:10%Edge weight distribution when top 10% nodes are to be selected for broadcasting. Blue: before Red : after减少了重载链路的数量!播存前后Internet网络流量分布对比 结果Core = 10%Core = 20%Core = 30%Core = 40%Core = 50%Core = 60%网络平均流量 vs. 播存网站数量 结果播存10%的核心节点WWW消耗的平均流量降低45.8%!骨干链路流量 vs. 播存网站数量 结果播存10
16、%的核心节点干路减负37.3%!播存的核心节点数量:10%播存前后Internet节点负载分布对比 结果Blue: before Red : after减少了重载节点的数量!Node weight distribution when top 10% nodes are to be selected for broadcasting. 播存前后Internet节点负载分布对比 结果Core = 10%Core = 20%Core = 30%Core = 40%Core = 50%Core = 60%网络平均节点负载 vs. 播存网站数量 结果播存10%的核心节点节点平均负载降低近 50%!骨干节
17、点负载 vs. 播存网站数量 结果播存10%的核心节点瓶颈节点负载降低 43.9%!播存网与其它信息共享技术比较与组播技术比较规模不受用户数和组数的限制大规模组播无法实现与DTN技术比较时效性更好与信息网格技术组合,建立基于播存结构的文化网格信息网格技术示意图仿真分析结论播存结构显著减少WWW共享信息业务量压力:用户数量增加双结构互联网,能够有效降低WWW流量负载即等效带宽成本;随着用户数量的不断增加,降低效果越发明显。网络规模增加双结构WWW网,其流量负载即等效带宽成本几乎不随网络规模变化而变化;而单结构WWW网的带宽成本会随网络规模增加而增加。扩展性与性价比优于现有其它技术(MC, DTN
18、)。清华大学CESL实验室参加人教 师:任勇教授、袁坚副教授博士生:陆俊秀、王磊硕士生:季成本科生:蔚松、姜寒(联系出国)本科生:曹耘(国家网络安全中心)发表文章 双结构互联网定量分析 THE END敬请各位专家指正 。清华大学 任勇 reny清华大学电子工程系复杂工程系统实验室(CESL) 2005-11-21组播技术共享信息解决方案单播模型组播模型Transit stub网播存性能仿真仿真参数定义结果-1: 网络规模与带宽成本定义:带宽成本为传递单位信息所消耗的链路带宽的总和(等效跳数)。结果-2: Transit域节点数与带宽成本T=1,K=3,Ns =100定义:带宽成本为传递单位信息所消耗的链路带宽的总和(等效跳数)。结果-3: Stub域节点数与带宽成本T=1,K=3,Nt =100定义:带宽成本为
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2024购买、使用软件合同书
- 2024店铺的装修合同范本
- 2024【船舶租赁简易合同】商场柜台租赁简易合同范本
- 2024解除土地租赁合同的样本
- 《企业员工手册》
- Spermidine-hydrochloride-Standard-生命科学试剂-MCE
- Sodium-glycolate-98-Sodium-hydroxyacetate-98-生命科学试剂-MCE
- 2024民办幼儿园承包合同
- 五年级数学(小数乘法)计算题专项练习及答案
- 四年级数学(上)计算题专项练习及答案
- 简单交通事故图解快速处理PPT课件
- 机器人学_机器人雅可比矩阵
- 家长会邀请函模板
- 空调工程评标办法
- 血液透析血标本采集
- 杭州嘉隆组合式干燥机说明书
- 孙子兵法与兵家智慧
- 果树病虫害防治管理论文
- 采动影响的基本规律及其应用
- 油井动液面检测新技术
- 糕点类产品出厂检验报告
评论
0/150
提交评论