




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
1、大数据”技术在工控行业中的应用可行性研究分析报告“大数据”时代的脚步已悄然而至,“大数据”(Big Data )已迅速成为近期 争相传诵的热门科技概念。 未来的十年将是一个 “大数据” 引领的智慧科技的时 代。专家们认为:“大数据技术就是下一个经济、国防、安全、社会活动等领 域的制高点!”“大数据”是继云计算、物联网之后信息技术领域的又一热点, “大 数据”时代的来临, 给各行各业带来了根本性变革, 让所有人都看到了 “大数据” 的挑战与机会。对于工业控制行业同样也是如此。本文即从“大数据”技术及其在工控行业中的应用研究的角度来探讨一 下“大数据”技术问题。一、吹响大数据“集结号” !“大数据
2、”( Big Data )这所以会成为热点,主要应归因于近年来互联网、 云计算、移动和物联网的迅猛发展。无所不在的移动设备、射频识别技术(RFID)、 无线传感器每分每秒都在产生着成千上亿的数据, 数以亿计用户的互联网服务时 时刻刻都在产生巨量的数据, 需要处理的数据量实在是太多、 增长实在是太快了, 而业务需求和竞争压力对数据处理的实时性、 有效性又提出了更高要求, 传统的 常规技术手段根本无法应对“大数据”浪潮。国际数据公司(IDC-International Data Corporation )预计,大量新数据无时不刻不在涌现,它们以每年 50% 的 速度在增长,或者说每两年就要翻一番多
3、人类社会发展的核心驱动力,目前,已由“动力驱动”转变为“数据驱动”经济活动重点,已从材料的使用转移到“大数据”的使用。 “大数据”正在成为 各个业界的焦点话题。 2012 年1月,在瑞士达沃斯举行的世界经济论坛上, “大 数据”是框定的主题之一。该论坛的一份报告, 大数据,大影响,宣告了“大 数据时代”的到来!今天已经进入“大数据”时代,身边的一切都在“大数据” 范围内。人们似乎再也没有什么秘密可言,各种信息都暴露在“大数据”之中。 “大数据”几乎是无处不在。传统行业创新升级, “大数据”成背后推手!企业 必须直面“大数据”的挑战。二、关于“大数据”的基本认识 “大数据”的定义什么是“大数据”
4、?从一般意义上说, “大数据”是指那些超过传统数据库 系统处理能力的数据,数据量通常在 10TB( 1TB=1024GB ,为 1 万亿字节)以 上。因为数据库、“大数据”已经成为变革的中心,事实上成为一场信息革命, 在 IT 领域、能源业、制造业、零售业、政府管理、 科技与国防军事等,“大数据” 都改变了整个世界的运行方式。因此,我们称之为“大数据“时代。对于什么是 “大数据”,目前业界并没有统一的定义。而根据维基百科的定义: “大数据 是指无法在可承受的时间范围内用常规软件工具进行捕捉、 管理、处理的数据集 合。”从产业角度,常常把这些数据与采集它们的工具、平台、分析系统一起统称为 “大数
5、据”。纵观人类历史,每一次划时代的变革都是以新工具的出现和应用为标志的。蒸汽机把人们从农业时代带入了工业时代, 计算机和互联网把人们从工业时代带 入了信息时代,而如今“大数据”时代已经到来,它源自信息时代,又是信息时 代全方位的深化应用与延伸。 “大数据”时代的生产原材料是数据,生产工具则 是“大数据”技术,是对信息时代所产生的海量数据的挖掘和分析,从而快速地 获取有价值信息的技术和应用。 “大数据”的量级20 多年来,各个领域特别是信息领域的数据量的加速增长,是“大数据”概念产生的基础。专家测算,2000年全球新产生的数据量为1000PB到2000PB ,到 2010 年仅仅全球企业一年新存
6、储的数据量就超过了 7000PB 。大数据二海量数据+复杂类型数据。目前全球每年产生的数据量是ZB级,到2015年会达到35个ZB。这表明,海量存储已经达到了 ZB级(1ZB=1000PB, 1PB=1000TB , 1TB=1000GB , 1GB=1000MB ),对于硬件系统已经超出 了传统的设计概念。 “大数据”的特点国际数据公司( IDC )认为,某项技术要想成为“大数据”技术,必须满足 IBM 所描述的三个 “ V ”:多样性 (variety) 、大容量 (volume) 和时效性高 (velocity) 。多样性是指数据应包含结构化的和非结构化的数据;大容量是指聚 合在一起供分
7、析的数据量必须是非常庞大的; 时效性高则是指数据处理的速度必 须很快。具体来说,“大数据”具有 4 个基本特征:一是数据体量巨大。百度资料表 明,其新首页导航每天需要提供的数据超过 1.5PB (1PB=1024TB ),这些数据 如果打印出来将超过 5 千亿张 A4 纸。有资料证实,到目前为止,人类生产的所 有印刷材料的数据量仅为 200PB 。二是数据类型多样。现在的数据类型不仅是 文本形式,更多的是图片、视频、音频、地理位置信息等多类型的数据,个性化 数据占绝对多数。三是处理速度快。数据处理遵循“ 1 秒定律”,可从各种类型 的数据中快速获得高价值的信息。 四是价值密度低。 以视频为例,
8、一小时的视频, 在不间断的监控过程中,可能有用的数据仅仅只有一两秒。 “大数据”技术的构成如果说“大数据”是一种技术,又具体包括哪些技术?专家认为, “大数据” 技术由四种技术构成:它们包括:分析技术、存储数据库、 NoSQL 数据库、分 布式计算技术。各种研究表明,“大数据”是与智能制造、无线网络革命并行的又一次颠覆 性的技术变革。其具体内容包括:海量数据分析技术、 “大数据”处理技术、分 布式计算技术、数据可视化技术。三、美国正在全面推进“大数据”研发2012 年 3 月 29 日,奥巴马总统发布大数据研发倡议 ,开启了美国“大 数据”全面研发工作, “大数据”作为信息时代获取、处理与利用
9、信息的一项核 心技术,正改变着国家安全、 社会经济发展乃至人类生活的各个方面, 已成为信 息时代大国竞争的一个战略性的新领域。美国甚至流行一句谚语叫“除了上帝, 任何人都必须用数据来说话” 。美国政府把“大数据”看成是“未来的新石油” 。美国 政府宣布 “ 大数 据研究和 发展倡议 (Big Data Research and Development Initiative )”,来推进从大量的、复杂的数据集合中获取知识和洞 见的能力。大数据研究和发展倡议提出,将提升美国利用收集的庞大而复杂 的数字资料提炼真知灼见的能力, 协助加速科学、 工程领域创新步伐, 强化美国 国土安全,转变教育和学习模
10、式。 大数据研究和发展倡议还承诺将在科学研 究、环境保护、生物医药研究、教育以及国家安全等领域利用“大数据”技术进 行突破。该倡议涉及联邦政府的6个部门(美国国家科学基金(NSF)、美国国家卫 生研究院(NIH )、美国能源部(DOE)、美国国防部(DOD )、美国国防部高级 研究计划局(DARPA)、美国地质勘探局(USGS)等六个部门)。这些部门承诺将投资总共超过两亿美元,来大力推动和改善与“大数据”相关的收集、组织和 分析工具及技术。 在这份倡议中还透露了多项正在进行中的联邦政府各部门的大 数据计划。主要内容如下:美国国家科学基金和美国国家卫生研究院主要推进大 数据科学和工程的核心方法及
11、技术研究,项目包括管理、分析、可视化、以及从 大量的多样化数据集中提取有用信息的核心科学技术; 国防部高级研究局项目主 要推进大数据辅助决策,集中在情报、侦查、网络间谍等方面,汇集传感器、感 知能力和决策支持建立真正的自治系统, 实现操作和决策的自动化; 美国能源部 试图通过先进的计算进行科学发现, 提供 2500 万美元基金来建立可扩展的数据 管理、分析和可视化研究所; 美国地质勘探局通过给科学家提供深入分析的场所 和时间、最高水平的计算能力和理解大数据集的协作工具, 催化在地理系统科学 的创新思维。五、“大数据”技术在工控行业中的若干应用研究 在电力行业的若干应用研究在电力行业,坚强智能电
12、网建设及“三集五大”管理体系的决策部署,对数 据的管理、 共享及互操作提出了更高的要求。 电力行业面临着正在形成的大数据 环境,为此, 需要不断挖掘大数据环境下的业务数据处理的潜在需求, 探索适应 电力数据的理论和方法, 使得电力信息系统的运维的外延向数据运维的范畴进一 步地拓展。 以更好地适应数据量的迅速增长、 数据类型的多样化、 数据时效性不 断提高。以智能电网为例,电网互联是电力系统发展的客观规律, 有必要加强研发大 规模互联电网的安全稳定运行技术、先进可靠的配电网与共用技术及微电网技术 为主的分布式电力系统。因此,采集、分析并有效应用“大数据”是解决能源与 公共事业关键业务的重要因素,
13、可以实现向智能电网转型、改善分布式可再生发 电的资产预报与调度、提高发电效率以及改变客户运营模式。大数据时代的作者舍恩伯格说,可以抽象地认为,智能电网就是“大数 据”这个概念在电力行业中的应用,就是通过网络将用户的用电习惯等信息传回 给电网企业的信息中心,进行分析处理,并对电网规划、建设、服务等提供更可 靠的依据。同时,对于风能、太阳能等具有间歇性的新能源,通过“大数据”分 析进行有效地调节,也可以使新能源更好地与传统的水火电进行互补,更为灵活地出力。在本质上,智能电网是“大数据”在电力上的应用。在电力行业,坚强智能电网的迅速发展使信息通信技术正以前所未有的广度、深度与电网生产、企业管理快速融
14、合,信息通信系统已经成为智能电网的“中枢神经”,支撑新一代电网生产和管理发展。“大数据”与电网的融合可组成智能电网,涉及发电到用户的整个能源转换 过程和电力输送链,主要包括智能电网基础技术、大规模新能源发电及并网技术、 智能输电网技术、智能配电网技术及智能用电技术等,是未来电网的发展方向等。电力企业是不是符合 “大数据” 应用的企业?享誉信息产业界多年的梅特卡 夫定律指出, 网络的价值与联网的用户数的平方成正比。 随着电力工业与信息化 的深度融合, 智能电网将承载着电力流、 信息流和业务流, 电网和电力信息通信 网的用户将发生叠加, 电网的整体价值会跃升。 这种价值的跃升将使电力企业具 有大数
15、据的时代特征。 电力信息通信将突破传统运维、 产生更多的增值服务, 甚 至催生新的管理模式创新。 数据中心将被赋予更多的职能, 比如强大的数据挖掘、 数据分析和决策能力。 电力企业业务数据主要来自生产数据和运营管理数据。 电 力企业生产数据既包括发电量、电压稳定性等实时采集的数据,也包括物联网、 云计算、新能源并网、移动互联、电动汽车充换电、车联网等技术带来的新数据 业务。电力企业运营管理数据,则包括交易电价、售电量、用电客户、ERP、一体化平台、 协同办公等方面的数据。 如能充分利用这些基于电力生产、 使用等实 际数据,对其进行深入分析, 便可以提供大量的高附加值服务。 这些增值服务将 有利
16、于电网安全检测与控制, 客户用电行为分析与客户细分, 电力企业精细化运 营管理等,实现更科学的需求侧管理。数据、信息和知识的“按需分配、恒值供 给、多次挖掘”将成为新经济形态的不竭动力,而“大数据”技术和应用成为决 策的辅助系统。“大数据”时代对电力行业发展提出新的挑战,但也带来新的发展机遇。 通过良好的数据管理, 并运用数据挖掘手段践行大数据战略, 将切实提高电力生 产、营销, 以及电网运维等各方面生产管理水平, 为使中国电力企业继续立于世 界先进行列提供强大的信息技术支撑。据悉, 2013 年 3 月,中国电机工程学会电力信息化专委会拟编制发布中 国电力大数据发展白皮书( 2013 ),这
17、将是我国首次就电力“大数据”问题发 布的白皮书。 作为电力信息化专委会秘书处所在单位, 国网信息通信有限公司承 担白皮书的调研和编写工作。 白皮书全文 12000 余字,分为引言、迎接电力“大 数据时代、展望电力“大数据”时代、迈向电力“大数据”时代、结束语等五 部分。这充分表明, 电力工业作为国家基础性能源设施, 与社会发展和人民生活息 息相关,是国民经济社会健康稳定持续发展的重要条件。积极应用“大数据”技 术,推动中国电力“大数据”事业健康发展,对实现中国电力工业科学发展具有 极大的现实意义。完全可以预期,“大数据”技术的在电力行业中的应用研究,仅仅是开始。 随着电力行业的不断发展, “大
18、数据技术”应用,将会不断扩展与深化。 有助于提升工控行业的“洞察力”所谓“洞察力”,指的是人对任何特定情况作出预见的能力。 在企业管理上, “洞察力”更意味着管理者必须拥有以数据为基础、 深入观察分析, 透过现象看 本质、将理论应用到实际工作中的能力。随着数据总量的持续增长和急速膨胀, “大数据”时代已经来临, 2013 年电力、石油等能源细分行业纷纷拉开了“大 数据”开发应用的序幕。 “大数据”技术强调的是从海量数据中快速获取有价值 信息的能力, 如何从海量数据中高效获取数据, 有效地深加工并最终得到有用的 数据是能源企业涉足“大数据”的目的。 “大数据”是以大量资料为基础,以更 加科学的方
19、式,进行分析、洞察的创新能力。实际上,进入“大数据”时代以来,现代企业正经历着规模化、多样化和高 速化的数据挑战。 越来越多的管理者开始意识到, 若无法对海量信息进行有效的 分析处理, 预测出潜在的业务风险, 便容易在竞争中处于劣势; 若无法通过有效 的沟通,确保洞察到的信息被较好地执行,则可能致使企业商机的流失。未来,企业会依靠洞悉数据中的信息更加了解自己, 也更加了解客户。 在这 个瞬息万变的时代, 面对各种随时可能发生变化的形势, 管理者不妨使用 “以洞 察获取先机、用沟通确保执行”的方式,制定各种应对战略,保证企业这艘“大 船”平稳行驶,在不断的竞争中获得胜利。企业管理公司SAP (全
20、球知名的企业管理和协同化商务解决方案供应商) 曾做过一项调查, 发现在任何行业中, 将 最具竞争力的企业与最不具竞争力的企业相比, 前者的员工受到更强洞察力的影 响的比例是后者两倍,由此可见,强大的洞察力对企业竞争优势起推动作用。归根到底,“大数据”的最终意义在于获得提升“洞察力”的能力和价值。 移动互联时代, 数据已经被认为是宝贵资源, 任何一家有雄心、 渴望获取洞察力 的企业,都应及早制定“大数据”战略和方案。否则,所有的机会将被“数据鸿 沟”所延宕。 “大数据”的核心:更准确地预测企业数据在“大数据”时代,数据与机器将在人类的日常决策中占有重要的地位。未 来,人类必须学会如何和海量的数据
21、相处。 从个体角度而言, 人类需要学会如何 平衡个人直觉与数字证据之间的关系; 从企业与组织角度而言, 人类需要探索企 业组织架构和决策流程与数据之间的关系; 从创新角度而言, 人类需要探索如何 打造合适的产业环境,促进更多的创新的“大数据”应用的诞生。 “大数据”时 代,海量数据处理与挖掘的技术固然十分重要, 但是,更为重要的因素仍然是人。 只有人,才能利用新技术与新方法创造性地搜集与探索数据中隐含的意义; 只有 人,才能最大限度地发挥数据的作用, 在机器与数据的支持下更有效地决策。 换 句话说,“大数据”的核心:是要求更准确地预测企业的数据。为了适应“大数 据”时代的来临, 企业需要从管理
22、者的思维方式、 企业的组织架构和信息环境等 多方面进行改变以与之相适应。企业“大数据”的应用一方面是与宏观经济、人民生活、社会保障、道路交 通的信息融合,促进经济社会发展;另一方面,是各个行业或企业内部, 跨专业、 跨单位、跨部门的数据融合,提升行业、企业管理水平和经济效益。 数据挖掘技术在工控行业里的应用数据挖掘,又称为知识发现 (Knowledge Discovery) ,是通过分析每个数据, 从大量数据中寻找其规律的技术。 利用大数据可对业务进行分析, 加工成有用的 数据,进而全面掌控企业业务。对电力行业来说,大数据是电力企业深化应用、 提升应用层次、强化集团企业管控的有力技术手段。随着
23、电力企业各类 IT 系统 对业务流程的基本覆盖, 采集到的数据量迅速增长。 电力行业面临的问题不仅仅 是收集和存储数据, 而是围绕数据采用相应的定量和统计信息, 挖掘更加有价值 的信息。如国网信通公司在北京亦庄的数据中心里,就设有 10200 个传感器, 它们及时采集数据,存储到云并进行分析和利用。数据挖掘是从海量实际应用数据中, 提取隐含在其中的、 潜在有用信息和知 识的过程, 是一个知识发现过程。 整个过程分为业务理解、 数据理解、数据准备、 建立挖掘模型、 评估和部署六个步骤。 即在开始数据挖掘之前, 我们必须了解业 务需求,根据需求明确挖掘主题、 要求和最终目标; 接下来便是对现有数据
24、进行 评估,并对原始数据进行组织、清理、集成、变换等一系列数据收集和预处理工 作;在搞好数据治理的基础上, 便可应用数据挖掘算法和工具建立挖掘模型; 之 后对所建立的模型进行评估,重点具体考虑得出的结果是否符合最初的业务目 标;最后,便可将发现的结果以及过程利用各种可视化技术(报表、报告、图形 等)呈现出来。 工控行业的“大数据”应用案例工业控制系统中“大数据”的应用研究。现举例如下:案例之一, SCADA 系统中大数据处理的研究与开发在 SCADA (Supervisory Control And Data Acquisition)系统,即数据采集与监控系统的实际应用过程中, 由于很多应用企
25、业的数据采集点很多, 同时由于应用方面 的实际需要, 通常需要把采集的数据保留一段很长的时间, 用于查询、分析和统 计。另一方面,很多数据的采集要求实时性较高,需要保持着较高的采集频率, 从而,数据库中的数据势必会越来越多, 因此,在保证系统稳定与正常访问的前 提下,将不可避免地面临着大数据的处理问题。如:某城市供水管网数据 SCADA 系统中有多个水厂, 每个水厂有多达上百 个数据采集点,包括了水温、水流量、水压力、水位以及其它多项监测数据。针 对此类问题, 在不改变数据采集周期、 不增加硬件设备的情况下, 通过优化数据 结构和算法, 完全可以达到提高数据访问速度、 提高系统运行效率的目的,
26、 可具 体进行优化。案例之二,大数据推动自动化和信息化融合2012 年 9 月 20 日,“第二届云计算大会暨大数据高峰论坛 ”在北京召开。 在此次以“云计算与大数据融合发展方向” 为主要探讨话题的高峰论坛上, 与会 嘉宾首钢集团自动化公司总工程师郭雨春做主题演讲。郭雨春认为,“首钢对数据应用历史,原来数据是一种资料,到后来变成资 源,到现在是一种资产。”“两化融合在制造业来讲应该是比较新的课题, 结合企 业的信息化来讲, 从管理角度来讲, 应该是精细化管理, 从生产流程来讲应该产 业升级。 这两个都离不开自动化和信息化支持。 就是因为要建立数字化企业, 实 际上这里面就是两化深度融合必然结果
27、,这里面是最关键是数据。为什么?就是说两化融合进程中, 首先要提到就是自动化和信息化之间关系, 我们认为信息化 这种发展高级自动化,所以在两个融合进程中信息化包含了自动化。为什么?就是因为有大数据, 有了数据的融合, 所以才出现了自动化和信息化的融合。 ” 毫 无疑问,大数据创业的前景十分广阔, “看不见的数据,看得见的价值”正给新 兴的通过数据创业的公司带来难以估量的市场潜力。案例之三,“大数据”支撑智慧城市建设未来智慧城市的建设将带来数据量的爆发式增长, “大数据”将像血液一样 遍布智慧交通、 智慧医疗、 智慧生活等智慧城市建设的各个方面, 城市管理正在 从“经验治理”向“科学治理”转变。
28、智慧城市是否真正 “智慧”源自“大数据”, 如何挖掘海量数据的潜在价值并为城市治理提供可靠决策和建议, 成为智慧城市 建设的关键。专家建议,中国必须抓住“大数据”时代的机遇,挖掘海量数据的 潜在价值,进而推进智能城市建设。结合智慧城市对信息的需求, “大数据”在智慧城市中的落脚点为为智 慧城市的各个领域提供强大的决策支持。 在城市规划方面, 通过对城市地理、 气 象等自然信息和经济、社会、文化、人口等人文社会信息的挖掘,可以为城市规 划提供强大的决策支持, 强化城市管理服务的科学性和前瞻性。 在交通管理方面, 通过对道路交通信息的实时挖掘,能有效缓解交通拥堵,并快速响应突发状况, 为城市交通的
29、良性运转提供科学的决策依据。 在安防与防灾领域, 通过大数据的 挖掘,可以及时发现人为或自然灾害、 恐怖事件, 提高应急处理能力和安全防范 能力等。中国工程院院士邬贺铨在 2013 年 1 月 11 日举行的 2013 中国智慧城市 年会上说:“大数据挖掘对智慧城市的经济发展和社会管理是无形的生产资 料,“大数据”价值的合理共享和利用将创造巨大财富。 ” 邬贺铨认为,智慧城 市是城镇化进程的下一阶段,是城市信息化的新高度,是现代城市发展的愿景。 智慧城市在产生大数据的同时, “大数据”也支撑着智慧城市的建设和发展。五、“大数据”技术应用的局限性这里,我并不是想说大数据分析不是一个好的工具。 而
30、是想说, 就像任何好 的工具一样, 它有它所擅长的地方, 也会其局限的地方。 而世界正因为不能 单从一个方面解释而显得有趣。就像任何工具一样,“大数据”分析也有其局限性。“大数据”的局限性是算法不能完全代替人的判断。实际上“大数据”在很多方面都无法取代人类的智慧和判断、 “大数据”可以处理大量非结构化数据, 弥补管理者过于依赖直觉的不足;但是人们也应当意识到, “大数据”也有很多 不擅长的地方:例如,无法对“情感”和“社会关系”等进行定性分析,原始数 据和分析结果会受到人类主观意识影响;又如, “大数据”不擅长上下文情景分 析;再如,“大数据”不擅长处理真正的巨型问题;还如,原始数据往往会被扭
31、 曲,数据分析的结论往往基于大众偏好。“大数据技术目前存在局限性,还不适用于所有企业。 “大数据”最美的地 方,就是我们不再受数据容量的局限, 它可以不断的增加一些变量, 然后增加价 值,帮助我们做出更好的决策。斯坦福大学专家特来沃尔? 哈斯蒂也“指大出数,据”的理论是“在稻草堆里找一根针”,而面临的问题则是“所有稻草看上去都挺像那根针” 。而乔治 ? 梅森 大学专家瑞贝克? 高尔丁则提出“数据提供者造假”的危险,在“大数据时代”变得更有害,因为“大数据”理论建立在“海量数据都是事实”的基础上,但人 们无法控制数据提供者和搜集者本人的偏见和筛选。近年来已有不少学者指出, 拥有最完善数据库、最先
32、接受“大数据”理念的华尔街投行和欧美大评级机构, 却每每在重大问题上判断出错,这本身就揭示了“大数据”的局限性。企业信息安全成为重大问题“大数据”堪称一把双刃剑,不论是企业还是个人,都会因为“大数据”的爆发而获益匪浅,但同时,个人隐私也无处遁形。站在不同的角度看“大数据” 它既可能是大机会,大发展,大创新,也可能是大危机,大破坏,大淘汰。由于“大数据”炙手可热,数据的流失、泄露和私下买卖也成为噩梦,全球各地不时发生的个人信息被盗可被看作“大数据时代”对个人生活的伤害,而“维基泄密 事件”则提醒强力部门和各国政府, “大数据”的魔力同样会对强者构成反啮。 数字世界扩大的同时也意味着危险随之扩大。
33、最近,通过美国人斯诺登的持续爆料, “棱镜门”公之于众,全球在感到触 目惊心的同时, 也不得不对美国收集数据的广泛和浩瀚叹为观止。 美国政府的神 通广大,一部分就是基于“大数据” 。进入今年的六月,美国“棱镜门”事件不 断发酵,为全球信息安全敲响了警钟。 “棱镜”折射出的隐忧:大数据时代你我 都是透明人!未知的安全威胁,让人不寒而栗。数据已经成为“企业的命脉” 。然而,我们既不应该过分迷信大数据、将现 有非“大数据” 技术马上弃之不顾, 也不应该将一切问题都推在 “大数据”身上。 很显然,传统技术不会瞬间“过时” 、新技术也无法一手遮天。“大数据”理论并非人人相信然而“大数据”概念似乎正被不顾
34、后果、毫无章法地过度使用;即使偶尔使用方法对路, 其适用范围也并不像技术人员想象的那么宽泛。 例如:美国学者就 质疑过“大数据”理论。微软研究院首席研究员、麻省理工学院公民媒体中心客 座教授凯特 ?克劳福德的文章对大数据的再思考 ,就从五个方面对大数据理论 提出了质疑:1,大数据中存在偏见和盲区。克劳福德认为,数字无法自己说话。不论其规模有多大, 数据集归根到底是人类设计的产物, 而大数据的工具并不能使人们 摆脱曲解、隔阂和错误的成见。2,大数据在一定程度上可以使城市变得更加智能和高效,但具体效果如何 取决于市政官员对数据及其局限性的了解 。3,大数据可能导致基于群体的歧视。大数据的倡导者认为
35、,“大数据对不同的社会群体不会厚此薄彼 ”,克劳福德认为,实际情况并非如此。大数据不 仅不会避免群体歧视,还可能加重这一趋势。4,隐私泄露是大数据应用中的重要问题。克劳福德认为,大数据的倡导者 关于“大数据是匿名的,因此它不会侵犯我们的隐私”一说是大错特错。5,大数据为科学研究提供了新的途径, 但不可断言“大数据是科学的未来” 。 克劳福德称, 大数据的研究方法只能统计某件事情发生的频率和相关性, 但不能 得出因果关系。将大数据策略和小数据研究相结合也许是更好的科学研究途径。现今对于“大数据”的预测或悲观或乐观,它究竟会如何改变人类社会,我们还将拭目以待。但是,专家认为:“大数据”的创新性、先进性与前瞻性,是值得肯定的。因此,辩证地看“大数据”对人类活动的影响才是正确地。“大数据”概念常常被过度滥用“大数据”这个概念常常被过度滥用,要么就是被完全错误理解。对于某个 特定应用程序中数据量的增加而言,无论这种增长幅度有多么迅猛,我们都不能 就将其称之为大数据应用。我们需要做的是对这套系统进行扩容, 而这个过程根 本没那么复杂一一只需做一些设计调整,如果系统本身就预留了扩展设计,连 调整都不需要。不过,一些学者指出,由于“大数据”理论过
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 2025至2030年中国半乳浊无光釉数据监测研究报告
- 2025年消防设施操作员之消防设备基础知识考前冲刺试卷B卷含答案
- 2023-2024学年广东省广州市天河区天省实验学校七年级(下)月考数学试卷(含答案)
- 2021-2022学年广东省广州市越秀区培正中学七年级(下)期中数学试卷(含答案)
- 2025年大学英语六级考试模拟试卷一
- 院感消毒知识培训课件
- 个人委托信息咨询服务合同
- 物理实验课教案:《力学实验操作技巧》
- 湖北省部分名校2024-2025学年高三上学期1月期末地理试题 含解析
- 吉林省长春市榆树市2024-2025学年八年级上学期期末生物学试题(含答案)
- 道路运输企业职业安全健康管理工作台帐(全版通用)参考模板范本
- PV-1200-(中文版)气候交变稳定性试验
- 户用分布式光伏发电项目投资协议书合同
- Q∕GDW 12068-2020 输电线路通道智能监拍装置技术规范
- CIR操作指南(20110513)
- 书法教案(高级)
- 《10万级净化车间标准》(2015版)
- 俞敏洪四级词汇词根联想记忆法乱序wordlist
- 公路工程试验常规检测项目、检测标准、检测频率、取样方法(标准版)
- M10砂浆配合比计算书(共3页)
- 服装测量方法及图示
评论
0/150
提交评论