下载本文档
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、1/ 6一)数据孤岛问题大数据的基础在于数据, 但是如果拿不到底层的数据, 数据 分析也就无从谈起。随着社交网络、移动互联网和物联网的兴起 以及社交媒体的发展导致各种海量数据生成, 带来了无限想象力 和商业应用价值。“第一个问题就是没数据, 理论上我们中国有很多数据, 但 实际做数据分析会发现非常困难。 ”中国科学院院士、北京大数 据研究院院长鄂维南表示, 数据孤岛是一个严重的问题, 从技术 层面看, 大数据的主要挑战是采集和分析。 不同部门的数据储存 在不同地方,大数据来源众多、数量巨大、形式各异。大数据最 高的层次就是用数据来形成智慧, 这需要从中获得一目了然的信 息。做数据分析先要整合数
2、据,整合数据需要真正高效、可靠的 数据管理和分析平台。社会大数据是一种社会公共资源, 由于政府部门之间、 企业 之间、政府和企业间信息不对称、制度法律不具体、缺乏公共平 台和共享渠道等多重因素,还有多样的设备、各式各样的应用场 景,导致大量政府数据存在“不愿公开、不敢公开、不能公开、不会公开” 的问题,早就了一个个企业和政府管理部门的数据孤 岛。阻碍数据共享的另一个主要原因是缺乏动力和担心安全。 贵 阳大数据交易所执行总裁王叁寿透露, 不少企业以保护商业机密 或节省数据整理成本等为理由,不愿意交易自身数据。在出行领 域,每天有上千万的出行记录和数百辆车的实时地理位置信息被 记录在出行软件上。
3、电商行业大量流转的货物,掌握着许多家庭 住址。这些大数据涉及到千家万户的财产甚2/ 6至人身安全,企业不 愿意泄露这部分信息。部分政府部门也缺乏数据公开的动力:有 的是因懒政而让数据沉睡,有的则是已经利用数据开展商业化应 用,因此不愿共享。“数据孤岛的痛不是技术问题, 是利益问题, 背后隐藏的利 益导致了数据孤岛的产生。 ”鄂维南坦言。对于如何打通数据孤岛, 加快政府数据开放共享, 政府要建 立完善大数据发展协调机制,稳步推动公共数据资源开放,将大 数据作为一项国家战略。大量的数据仍然掌握在个别企业和政府 机构中,要想实现共享和保证信息安全, 还要统筹规划大数据基 础设施建设,推动制定公共信息
4、资源保护和开放的制度性文件, 明确数据开放共享的原则和底线。中国的大数据才刚刚起步,若想打通城市现存的信息壁垒,就要让城市多方资源联动起来,搭建城市数据共享的平台,从而 形成良好的数据开发和使用氛围, 激活大数据价值, 充分发挥数 据资源整合的优质效应。(二)底层技术差距很大即便解决了数据共享问题, 数据可供随时取用, 每天天所产 生的海量数据需要有一个强有力且安全的平台来对这些数据进 行收集、分析。微软大中华区董事长兼 CEO 可睿杰认为,数据智 能并非那么触手可及。要想从来源众多、数量巨大、形式各异的 大数据获得一目了然的信息, 就需要真正高效、 可靠的数据管理 和分析平台,从而为用户提出
5、一个切实可行的方案。中国当前的数据产生量占全球数据总量的13%,增长速度也3/ 6很快,如图 3 所示。如何处理巨量数据是中国大数据产业面临的 首要技术问题。 中国的数据体量特别大中国的视频比任何国家都 要多,这些数据储存困难,需要用的时候往往就没了。59%的数据是无效数据, 70%的数据过于复杂, 85%的企业数据架构无法适 应数据量和复杂性增长的需求,98%的企业无法及时、准确地为业务提供正确的信息。这些问题都给数据统计分析带来了困难。另一方面,数据分析本身也是一个难题。 大数据中, 绝大部分属 于非结构化的数据,无法用数字或同意的结构表示。 这些大量存 在于社交网络、互联网和电子商务等领
6、域的大数据,在高维、多 变和强随机性等方面表现出不确定性。 股票交易数据流就是不确 定性大数据的一个典型例子。 研究和应用这些数据需要结合包括 数学、经济学、社会学、计算机科学和管理科学在内的多学科交 叉。4/ 6图 2 中国大数据细分市场结构情况2011-2018年中国大数据产业营收规模及增速图 3:2011-2018 年中国大数据产业营收规模及增速目前,我国大数据技术创新能力还有待提升。大数据产业发展规划(2016-2020 年)指出,我国在新型计算平台、分布 式计算架构、大数据处理、分析和呈现方面与国外仍存在较大差 距,对开源技术和相关生态系统影响力弱。同时,大数据应用水 平不高。我国发
7、展大数据具有强劲的应用市场优势,但是目前还5/ 6存在应用领域不广泛、应用程度不深、认识不到位等问题。我们在大数据应用上并不落后国外, 但是在底层技术上远远 不及国外,技术都来源于谷歌等国外大公司。 很多时候我们的商 业模式走在了技术前面,并没有通过技术手段来推动创新。国家层面要支持大数据共性关键技术研究,加强海量数据存 储、数据清洗、数据分析发掘、数据可视化等领域关键技术攻关, 并支持自然语言理解、机器学习、深度学习等人工智能技术创新。(三)专业人才短缺严重近年来,大数据成为一个新兴热词越来越被人们所提及。我国大数据产业发展进入爆发期, 对于企业来说,大数据的影响更 为猛烈。由于成熟的人才培
8、训体系尚未建立,企业数据爆炸性增长给企业带来了隐患,直接导致人才短缺的问题日益突出。大数据面临的最严重的问题就是应用场景和人才的问题,应用场景的问题是需要时间,作为一个新兴发展起来的产业, 对大数据人才 的需求开始成爆炸式的增长。人才不足限制了大数据产业创新发展的成效。清华大学计算机系教授武永卫透露的数据显示,未来 3 至 5 年,中国需要 180 万数据人才,截至目前,中国大数据从业人员只有约30 万人。LinkedIn (领英)发布的2016 年中国互联网最热职位人才报 告则显示,数据分析是当下中国互联网行业需求最旺盛的6 类6/ 6人才职位之一。I同时,大数据行业选才的标准随着大数据的发展也不断变 化。初期,ETL 研发、系统架构开发、数据仓库研究等偏硬件 领域对大数据人才的需求较多,倾向于需要具有 IT 、计算机背 景的人才。随着大数据从水平领域往各垂直领域的延伸发展, 对, 从事数据分析、数据挖掘、人工智能等偏软件领域的统计学、数 学专业的人才的需求不断加大。在高端人才稀缺的现实情况下, 越来越多的企业希望能够培养自 己的大数据分析人才。 企业多选择从海外和传统行业挖掘跨界人 才,薪酬待遇
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025海南省安全员-B证(项目经理)考试题库
- 2025年-辽宁省安全员知识题库
- 2025青海省安全员B证考试题库及答案
- 2025年湖北省安全员A证考试题库附答案
- 2025辽宁建筑安全员考试题库及答案
- 建筑用花岗岩开采及建筑用碎石、机制砂加工项目可行性研究报告模板-备案拿地
- 英语英语时态课件
- 一年级语文《-jqx》课件
- 单位管理制度展示汇编【人事管理】
- 单位管理制度展示大全职员管理篇十篇
- 北师大版五年级数学下册第3单元第2课时分数乘法(二)课件
- 教育部中国特色学徒制课题:中国特色学徒制制度设计与运行机制研究
- 城市规划思想史
- 山东师范大学新闻采访期末复习题
- 让与担保合同协议范本
- 住宅设计效果图协议书
- 新版中国食物成分表
- 2024河南郑州市金水区事业单位招聘45人历年高频难、易错点500题模拟试题附带答案详解
- 食物损失和浪费控制程序
- TCI 373-2024 中老年人免散瞳眼底疾病筛查规范
- 2024四川太阳能辐射量数据
评论
0/150
提交评论