共享文化大数据的新机制课件_第1页
共享文化大数据的新机制课件_第2页
共享文化大数据的新机制课件_第3页
共享文化大数据的新机制课件_第4页
共享文化大数据的新机制课件_第5页
已阅读5页,还剩11页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、共享文化大数据的新机制李幼平 杨 鹏2013年4月追求“内容自寻读者”万维网(World Wide Web)是“博大精深”的文化大数据,它与个人的有限需求之间,缺乏顺从人意的直达机制本文建议,定义最小内容基元,并借助泛在无线电广播,创造“内容自寻读者”的主动服务机制新机制不但能大比例分担核心网的共享类流量,而且有望从国家层面找到保证公共内容安全的有效措施 共享文化的三个科学问题奥巴马政府又出了“大数据”的题目,要求科学家从大数据中萃取有价值的信息,并从国家层面找到保证信息安全的有效措施。中国政府发出“用好互联网,管好互联联网”的号召,提倡用“三网融合”营造“国家公共文化服务体系”。无论“大数据

2、战略”还是“公共文化战略”,提法虽然不同,最终都希望实现全民对文化大数据的科学享用,都需要回答三个科学问题:1,共享如何不限人数?2,服务如何匹配个人?3,国家如何依法治理?试图借助网络物理变革回答问题无线复制体现网络物理变革无线电广播轻松回答三个问题中的两个无线电是“一点对无限点”的单向电磁辐射“无限点”意味着支持“共享不限人数”,不管多少人分享电磁波带来的数据,永无“带宽拥塞”“一点”支持内容集结一体,在卫星实施分发的过程中,国家自然获得理顺内容和依法管理的机会唯一障碍:单向系统没有互动环节,难以匹配个人广播内容自带互动环节,障碍将出现重大突破具体办法是,文件前缀嵌入沟通读者与作者的语义短

3、包作为取舍内容的文化基元,让作者与读者在网络终端实现直接互动自帯互动环节:1kB内容标签毕升把汉字当成是可按语义聚分的最小文化基元;网络需要可按语义取舍的最小文化基元UCLUCL(Uniform Content Label)统一内容标签表达读者喜好(个人常用网站、栏目,或感兴趣的专业话题)5B1 KB表达作者语义(描述内容的要义)支持依法管理(国家授权,科学管理)8B1B2B16B64B100B100B128B600B网站栏目专业话题时间戳内容代码内容标题内容要义内容出处指纹内容指纹待定定义泛在广播无线电波转瞬即逝,“泛”而“不常在”存储和内容匹配技术帮助它成为 anywhere、anytim

4、e、anyone 的 Ubiquitous Data Radio UD Radio发明超级门户机制内容标签UCL含有标题、摘要,本身是一种可读的短文件把大量网站的UCL短文件集结一体,形成海含众多网站主页的“超级门户”(super portal)其他媒体都是“零阶”的,唯独它是“高阶”的超级门户是“有关数据的数据”(data about data),是“引领众多媒体的超级媒体”(medium about media)集结后的UCL内容品种足够多,千差万别的个人都可以从中得到个性需求的提醒;集结后的总字节量又足够地小,只需用一个低速率的广播信道,就足以承载多元内容面向全民的泛在服务。广科院的低码

5、率UD Radio广播科学研究院发明一种调频波段的低码率OFDM信道,形成穿墙入户“直达所有网络的所有终端”的物理能力。由于码速率很低,接收环节是一种功耗极低的嵌入式小芯片,很容易寄生于PC机、TV机、Pad机、手机的主芯片之中UD Radio每天把百万种UCL数据包直接存入任意网络的任意终端,广大民众可以在第一时间免费得到任意媒体的任意标题摘要。从工程上体现主动服务的超级门户机制。互联网边缘增添广播结构图3 Internet的边缘增添泛在广播的次结构减少内容分发跳数“小世界”的说法起源于Milgram的“六度分离”猜想,即全球几十亿人中的任意一人,经过五次中间介绍,总可以找到另一位陌生的人。

6、1998年,Watts等人在NATURE杂志上发表题为“Collective Dynamics of Small-World Network”的论文,指出聚类动力学是小世界的成因。对获取网页的平均路由跳数D进行实测统计,得知WWW网络90%以上网页的 D在 6与 23之间。出现DlnlnN超小世界2009年PHYSICAL REVIEW LETTERS杂志发表题为“Navigating Ultrasmall Worlds in Ultrashort Time”的文章指出当幂指数处于2至3之间时,采用贪婪路由可使网络的DlnlnN,并可实现超短时间的内容引导。其中N为网络节点总数量,取N等于全球

7、人口70亿,则可算得D3,超越了原先“六度分离”的猜想,实现了“超小世界”和“超快引导”。这是一个了不起的理论工作,激励中国专家坚定信心,朝着更小跳数的目标继续前进。东南大学D1的梦想东南大学团队发现,直接关联复杂网络理论的“度分度”和“平均程长”,有可能通过简单的内容匹配计算而不是通过复杂的路由计算实现更小的平均跳数或者说,迫近D1的更高理想。为了实现这一目标,未来网络只需要在基于对流的Internet主结构的边缘,添加如图3所示的辐射复制的泛在广播次结构B-C-S。流量的边缘分担机制泛在广播次结构形成流量的边缘分担机制,内容共享类业务将被D1单跳互动分担D1有利于IP核心网化解“十年千倍”

8、的扩展性困惑。同时D1,意味着攻击者只能在局域网内做坏事,攻击成本提升,防卫成本下降。D1,意味着提升QoS主要只需改善最后一跳的带宽,而不是核心网络的带宽。D1,意味减免高速路由计算和高速搜索计算的能耗。支持内容依法管理利用Hash函数产生一个加密“检查和”,若遭篡改“检查和”将异样,内容即被视为非法。在IP环境中,Hash指纹仍然存在安全漏洞。我们建议改用UCL格式通过卫星转发Hash指纹。卫星转发是一种难以施加攻击的非开放物理信道,UCL的时戳又具有“时不再来”的唯一性,同时篡改指纹与内容,几乎是不可能的。国家注册机构卫星发放的哈希指纹,任何地点上的任何终端,都有可能在域名和路由均不可信的情况下,直接判断公共内容的真伪,保护公共内容的安全,确保国家长治久安。 Cyberspace 矢量化“大数据”只是 Cyberspace内容多少的模量描述,缺失语义化的矢量描述假设1kByte为文化数据单位模量,用1kByte的语义短数据包 UCL作为单位矢量,直接沟通作者与读者的意向,把人的因素植入网络单位矢量通过无线电辐射治理中国互联网,理顺杂乱无序的文化大数据,用尽可能少的路由跳数,把有价值的内容分发给每一位个人中国领先全球,首创公益、基本、均等、方便的大文化:公共文化服务体系结束语无线电是一种“一点对无限点”的电

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

最新文档

评论

0/150

提交评论