从数到大数据的三个演变阶段,自然辩证法论文_第1页
从数到大数据的三个演变阶段,自然辩证法论文_第2页
从数到大数据的三个演变阶段,自然辩证法论文_第3页
已阅读5页,还剩7页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

从数到大数据的三个演变阶段,自然辩证法论文随着科学技术的飞速发展,数据在科学研究和社会管理的认识论和方式方法论中的作用越来越重要。在信息化时代,数据随时随地与我们相伴而行,用数据讲话已成为认知世界的一种方式方法。近年来,大数据已经引起全社会的广泛关注,这主要源于全球数据以40%的高速度急剧增加;更为重要的是,大数据触及到几乎所有的领域,并对政治、经济、教育、文化、科技等领域乃至于整个社会带来认识和生活方式的变革。数据被以为是一种与能源和材料相提并论的资源,其所蕴涵的价值难以估量。大数据时代带来了新的机遇和挑战。面对潮水般涌来的数据,解读数据所包含的信息和知识是当下科学家们致力追求的目的,进而推动了信息技术的发展,并带动了大数据的广泛应用。然而,人们对大数据乃至于数据的内涵和本质当前还没有统一的认识,我们试图从历史的视角,对数到大数据的演变进行考察,以期理解数据在社会发展中的革命性作用,对数据的内涵进行进一步的理解。本文提出从数到大数据的历史可划分为3个重要阶段,数据的产生、科学数据的构成和大数据的诞生作为其标志,并指出在科学数据和大数据阶段所引发的认识论和方式方法论上的重要变革可视为两次数据革命。一、从数到大数据的历史发展至今为止,学术界对数据还没有统一定义。广义上讲,数据包括数、量、数据和大数据,这是由于从数据的发展历史看,数据由数、量演变而来,大数据是信息技术和计算方式方法的发展引起的必然产物,是对一般数据的拓展,因而对数据的认识必须涵盖从数到大数据的各个发展阶段。在数据的发展进程中,其历史地位经历了从应用工具到构成我们对事物认识的基础、根据,再到因数据本身所蕴含的大量信息而被作为知识挖掘的直接对象等不同历史阶段;数据的类型从构造性数据数值、数字发展到包括非构造性数据图、表、文字均可数字化的所有形式。数据的演变是一个渐进的经过,它不是简单的一种形式代替另一种形式,而是一个由简单到复杂的各种形式互相包涵、不断丰富的经过。我们以数据与技术、自然科学研究和社会科学研究的关系为根据,将数据的发展分为3个历史阶段:介绍计算机软件HiQ的文章(大数据的处理程序〕〔AHandlerforBigData〕中第一次使用了大数据〔bigdata〕一词。2008年9月(自然〕杂志出版bigdata专刊,使大数据在学术界得到认可和广泛使用。学者们从互联网经济、超级计算、生物医药等多方面关注大数据带来的技术挑战、现有技术以及将来的发展方向。2018年,Bollier以为,计算机存储技术,产生数据流的设备,如摄像机、望远镜和交通监视设备,云计算,面向消费者的应用,如GoogleEarth和MapQuest,成为大数据产生的几个重要因素,并初次提出一种新的知识基础设施正在实现,大数据时代正在出现的观点。究竟何为大数据?Manyikaetal.以为大数据是指数据集合,其大小已经超出了典型数据库在获取、存储、管理和分析的能力。到达多大的数据叫大数据,当前还没有一个普适的定义,一般以为,大数据的量级应该是太字节,即240。大数据的意义在于,为人类分析和使用的数据的量在增加,通过对大数据的交换、整合、挖掘和分析,能够发现新的知识,创造新的价值,带来大知识、大科技、大利润和大发展。二、数据革命2007年,已故图灵奖获得者吉姆格雷〔JimGray〕在加州山景城召开的NRC-CSTB上,做了(第四科学研究范式:密集型数据挖掘〕的演讲,提出eScience是科学范式的一次革命。根据格雷的观点,科学已经经历了几千年的历史演变,构成了四个关键性科学范式。第一个是经历体验范式,几千年来,以实验观察为主,描绘叙述自然现象;第二个是理论范式,在过去的数百年时间里,科学研究出现了理论研究分支,研究手段采用模型和归纳方式方法;第三个是计算范式,近几十年,针对科学研究面临的复杂问题,仅仅用理论研究建立的模型难以解决,模拟复杂现象的计算模拟方式方法应运而生;第四个是数据挖掘或eScience范式,最近几年,实验、理论、模拟不同渠道正在产生大数据,这些大数据蕴含着大量的信息知识,对其挖掘研究已经成为一种新的科学范式。与格雷德四个科学研究范式相对应,我们将数据的历史性变革归纳为两次数据革命。1.科学的数学化第一次数据革命是指近代科学诞生之时,数据在科学研究中的基础地位得已确立,实现了数据与科学研究相融合,促成了科学革命的发生。从近代科学开场,数据与科学进行了完美结合,展示了数据的宏大魅力。无论是科学理论的产生和发展,还是实验科学对理论的验证,数据无处不在。随着科学和技术的发展,数据的形式和内涵也在不断变化和发展,除观测数据外,实验数据、理论数据、统计数据、模拟数据以及由图、表、文字的数字化随科学技术的发展而相继诞生。对研究经过和结果赋予精到准确化的诉求是近代科学的基本特征之一,近代科学构成了一套完备的研究范式,这种研究范式包括:由科学的数学化而产生的数理方式方法,和以实证研究为目的的实验方式方法,而数据在数理方式方法和实验方式方法中始终处于基础地位。世界这本书是由数学语言写成的认识论观点,使数据成为科学认知经过和科学知识积累中的根据。科学的数学化,使原属于不同范畴的质和量由数据进行统一表征,实现了数据在各自学科体系之内的可通约性,数据的使用和获取成为科学家们关注的焦点,科学仪器的进步使数据的获取如虎添翼。随着科学技术的发展,数据的基础地位从来没有被削弱过,反而逐步加强。加拿大哲学家西斯蒙多以为,科技哲学中的两大基本流派逻辑实证主义和证伪主义均将理论和数据之间的关系置于科学的核心。逻辑实证主义强调科学的归纳经过,数据起到了的根据性作用;证伪主义愈加强调科学与非科学的划界标准,数据起到判据性作用。甚至将以数据为根据的实证研究作为判定科学与伪科学的标准,十分明显的是社会科学研究一度由于缺乏数据的支持被排除于科学之外,被冠以伪科学。科学数据是确定的和准确的吗?近代科学确立的机械自然观以为,客观性和确定性是认识论的基本要素,因而描绘世界的数据语言是确定的和准确的。17世纪,产生了基于大量数据的统计数据,以此建立的统计学使事物的或然性和偶尔性被认识。面对多体问题等复杂性问题,使用传统的实验数据和理论数据已经不能知足需要,通过计算机产生的数值模拟方式方法促成了模拟数据的诞生。20世纪最为出色的科学成果量子力学引入了不确定性和互补性的概念,引发了人们对测量数据确实定性和客观性的质疑,观察浸透理论使人们意识到数据在表征现象时存在误差,对数据准确性的内涵有了进一步的认识。2.大数据第二次数据革命是指21世纪大数据的产生及其使用,它不仅改变着科学研究范式,实现了社会科学研究的定量化,而且将促使经济、社会、军事等所有社会领域产生宏大的变革。在科学研究方面,大数据将改变传统的研究方式方法。通过遥感装置、感应器、计算机收集数据或模拟方式方法获取的密集型数据,经过计算机软件处理,产生的信息/知识被存储在计算机中,科学家们只需在后台利用数据管理和统计的方式方法对数据进行处理、分析,获取知识。计算科学将再次大显神通,将以大数据为基础的密集型科学区分出来,作为一个新的、科学探寻求索的格雷第四种科学范式。〔[22],p.X〕密集型数据由下面几个公共构件组成:〔1〕数据采集,〔2〕数据管理,〔3〕建模与仿真,〔4〕算法,〔5〕信息分析,〔6〕系统平台。大数据是数据密集型计算的一种,需要新的公共构件来应对庞大数据的挑战。大数据可能导致社会科学研究的革命,使社会科学成为像自然科学一样的实证科学,其定量研究成为可能,使其告别伪科学的行列,成为科学殿堂的一员。哥伦比亚大学沃茨博士通过研究发现,大数据对极其复杂的人类行为的社会学研究起到了极其重大的作用,通过网络数据,大量的个人的或很小组织的真实行为通过计算机以数据形式被记录下来,这些数据为人类行为研究提供了极其丰富的可靠信息,避免了研究者认知的偏见、感悟的误差和框架的歧义。大数据再次突破了自然科学和社会科学的研究界线,实现了数据的可通约性,通过数据沟通了不同学科的资源分享。大数据对经济、社会、人类日常生活产生的影响不仅仅限于技术层面,而且对于管理理念、运作方式都将产生宏大的影响。数据驱动的社会管理就是在社会管理中施行的一种新型管理形式,无论是还是组织机构,数据收集和数据分析已经成为基层管理部门的基本要求,根据数据分析结果制定政策和法规,将社会管理从事后处理惩罚转向事前防范,在医疗健康、国土安全、智慧城市建设、防备和打击恐惧活动社会治安、治理社会腐败等方面发挥着重要作用。20世纪美国的警务管理形式CompStat〔一种新的治安信息管理系统〕是利用大数据对社会治安进行管理,并获得良好成效的成功范例。利用地方各种传感器收集的大数据和通过互联网搜索本文关键词语,疾病控制部门能够预测和判定某地的流行病爆发的情况。商务智能实现了从数据到知识的挑战和跨越,决策支持系统更是以数据和信息为主要来源,等等。无论是数据驱动的社会管理还是决策支持系统,数据的获取和对数据的挖掘都至关重大,对收集到的各种数据,在后台进行分析,建立模型,利用云计算等计算手段,为制定政策、法律和决策提供技术支撑。各国已经意识到大数据的重要性,将其视为与能源同等重要的资源。2020年3月29日,代表美国的白宫科技政策办公室发布了(大数据研究和发展计划〕,并成立了大数据高级指导小组,将大数据技术革命带来的机遇和挑战提升到国家战略层面。在移动网络、云计算和其他技术的支持下,大数据迅猛发展,同时,分析数据的技术不断创新,这些经过和收益既鼓舞人心,同时也令人担忧。大数据在推动社会变革的同时也造成了社会风险,例如,个人隐私、数据的客观性和准确性、大数据的滥用等问题,已经普遍达到科学研究、社会管理、医疗保健、商务智能等诸多领域。三、结束语综上所述,数据是人类认知活动的产物,是对客观事物的主观反映,是对事物现象进行表征的一种逻辑语言。科学数据由于其简单性、精到准确性和普适性,已经成为科学研究的基本组成要素之一;大数据随着计算方式方法和信息技术的快速进步而诞生,当前已在诸多领域成为分析、管理、决策等赖以进行的重要资源,是发现知识、创造知识和认识世界的一种新范式,对其的进一步研究已引起世界各国的高度重视。从人类发展的历史来看,数的产生是从人类本身的生存、生活需要开场的,也正是这种需求推进了数到数据的发展,从观察数据的收集到技术中数据的使用,功利主义的性质无处不在。真正让数据从实用到抽象和理性则要归功于古希腊的哲学家,他们第一次远离实用主义,将其看成是事物的本源,这种思维方式也为自然哲学的研究开拓了新的道路。从数据的发展历史来看,今天的数据已经将数、量全部囊括华而不实。自数的概念产生以来,数据与其它语言文字一样是人工产物,是用于记录事物的性质和沟通的工具。从广义的角度讲,数据能够被以为是语言的一部分。与文字语言不同的是,数据的表示出形式更为简单,固然不同的文明起源地有不同的记数方式和不同的数制,但随着文化的交融,数据形式的高度统一超出了所有文字语言,这无不与其简单性和精到准确性密切相关,也愈加有利于沟通。数据因其是研究对象的本征表象而成为归纳和演绎出其内在规律的根据。从科学技术发展历史来看,科学数据之所以成为重要的研究手段,源于其精到准确性、一致性和易沟通性的特征。数据的客观性仍然遭到人类主观因素的影响,这一特性从数的产生就一直存在。能够讲,数据是事物客观性和人类主观性的纽带,也是人类认识世界的桥梁。然而,由大量数据构成的大数据的内涵和其神秘性,仍然是科学家和哲学家有待进一步研究的重要领域。数据不仅介入到社会、科学、技术等领域的变革之中,其本身也发生着革命性变化。数据以其实用性成为其产生发展的基础,数据与技术的自然结合是其先天性具体表现出。近代科学中数据基础性地位确实立,是数据与科学融合的结果。21世纪信息技术的发展导致的大数据正在引发一场波及所有领域的革命,大数据已经从工具、根据性角色上升到本身蕴含有待开发的信息和知识的资源地位。大数据引发的革命使人类世界正面临新的机遇和挑战。然而这场大革命需要解决一系列基础型问题,如数据的本质、性质、类型和价值;大数据引发的诸如隐私、安全和版权等问题;数据的获取、挖掘和分享的技术难题;以及相关数据科学家的教育和培训等问题。人们对这些基本问题进行的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论