中国数据新闻的伦理困境与出路_第1页
中国数据新闻的伦理困境与出路_第2页
中国数据新闻的伦理困境与出路_第3页
中国数据新闻的伦理困境与出路_第4页
中国数据新闻的伦理困境与出路_第5页
已阅读5页,还剩10页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

中国数据新闻的伦理困境与出路

一数据新闻:新闻报道模式的变革(一)“数据新闻”概念探讨数据新闻又叫数据驱动新闻,目前尚未有一个比较统一的定义,但是已经有很多数据新闻从业者及相关学者对这一新的新闻报道模式进行了阐述。20世纪90年代中期,美国和英国的一些新闻机构就已经设计了一些数据新闻项目。那时还不叫数据新闻,叫计算机辅助报道(Computer-assistedReporting)或计算机报道,“数据新闻”被记者公开使用是在2011年1月的新闻骇客盛会NICAR(theInternationalforComputer-assistedReporting)后,会议认为,“计算机辅助报道”这一概念已经无法阐述这个行业的实践。这次会议后,“数据新闻”的概念在记者群体中被广泛使用。Anderson把计算机辅助报道定义为“算法的、社会科学的和精确的报道形式”[1],计算机报道(ComputationalJournalism)是“为增强新闻报道的问责功能而进行的算法、数据和社会科学知识的结合”[2]。“精确新闻”指的是记者在进行新闻报道时使用社会科学研究方法来收集新闻素材,完成新闻报道的采写,这些方法包括调查、实验和内容分析等。[3]“精确新闻”“计算机辅助报道”“数据可视化”“数据新闻”密切相关,甚至容易引起混淆。中国人民大学的喻国明教授专门对“精确新闻”“计算机辅助新闻”“数据库新闻”“数据新闻”的发展历史做了详细的梳理,他认为,与计算机辅助新闻和数据库新闻相比,数据新闻对新闻生产的思路和流程的改造是根本性的。[4]《纽约时报》的AronPilhofer指出,数据新闻提供信息和相关分析以帮助人们了解一天中所有的重要事件。[5]数据新闻加大了新闻对改善民主的贡献,特别是如今政府公布的数据正在不断增加。数据新闻可以从三个方面做到这一点,第一是增强新闻的客观性,第二是提供新的新闻报道工具和组织来保持政府问责,第三是提高公民的政治参与。[6]虽然“数据新闻”的概念还未达成共识,但是就学界和业界的人士对其描述来看,他们对数据新闻的认识有一定的共通性,基于此,把握“数据新闻”的概念需要注意以下几点。第一,数据新闻发展的基础是互联网技术的发展带来的开放数据的兴起。互联网技术的发展对整个人类的生产、生活方式带来了巨大的变化,也给人们的交往方式带来了巨大的变革。Web3.0和移动通信技术,使得个人成为信息发布者,社交平台聚集了大量用户,用户在赛博空间密集的交互行为被记录下来,使得海量用户信息的精确收集成为可能。“偷”数据并不是难事,从那些公开的excel、word、PDF、TIFF文件中复制、粘贴一些摘要在开放数据时代非常容易,运用开放数据集,一系列新的数据集很容易被创造出来。[7]第二,数据新闻是数据和社会科学知识相结合的一种报道形态,它的生产离不开对数据的采集、分析处理与可视化呈现。数据新闻不仅只有数据,更重要的是生产数据的人们,如果说对数据的操作需要的是数据爬虫技术、编程技术的话,那么想要解开数据背后的故事——数据新闻,就需要分析人类社会行为的社会科学知识。第三,数据新闻的概念并不是某一个人提出的,它的出现得益于全世界数据新闻从业人员的实践探索。“精确新闻”的概念是菲利普·迈耶个人提出来的,但是数据新闻概念的出现是众多数据新闻记者实践探索的结果,并不是哪一个人总结出来的。(二)数据新闻对传统新闻报道模式的变革如今,数据比之前任何一个时代都容易得到,全世界的政府机构都存储、公布了海量数据,记者也大量地运用数据来报道公众感兴趣的议题。在2011年和2012年,凭借专业的操作和大量的实践,《纽约时报》和《卫报》走在了世界数据新闻报道的前头,两家媒体围绕暴乱、同性恋、犯罪等议题展开了大量的数据新闻报道并取得了巨大成功。这也使数据新闻这种新兴的新闻报道形式逐渐被广泛使用。这种新的新闻报道方式与传统的新闻报道有很大不同,主要有以下几点。第一,新闻来源。新闻来源即新闻事实是由谁提供的,传统新闻报道的新闻来源主要有政府机关提供的线索、广大受众提供的线索、新闻工作人员自己发现的线索。这些线索往往是一些具体的事件、事实的变动,数量有限。数据新闻最核心的部分是数据,数据新闻的数据来源主要有三个部分:一是新闻机构自身的采集;二是一些机构的开放数据,包括政府公布的数据和其他机构公开的数据;三是第三方机构出售的数据。数据新闻的新闻来源往往是很多事件、数据的集合,着重分析大量事件、数据之间深层的联系。第二,生产流程。传统新闻的生产流程包括发现新闻线索、选题策划、采写和最后的呈现,而数据新闻的生产流程一般是关注一定的主题,运用相关算法获取大量的所需数据,利用数据分析工具对数据进行处理,最后运用可视化技术完成数据新闻的呈现。相比传统新闻报道对人的个人采写能力的极大依赖,数据新闻的生产更加依靠数据技术来完成相关报道。此外,传统新闻报道的生产流程是线性的,采编、设计和印刷一个在前一个在后,而数据新闻往往是三个程序同时进行,必要时会对生产环节进行实时调整,整个工作流程是非线性、合作式的关系。第三,报道呈现方式。传统新闻报道与数据新闻报道呈现方式的最大区别在于新闻作品的可视化,虽然传统新闻报道也会采用图表等表现方式,但是由于数据数量的限制、传播载体的掣肘,这种表现只是简单的文字向图表视觉表达的转换,信息量有限,数据新闻鉴于其对数据更加深入的挖掘、处理,其可视化呈现能够深入挖掘事件之间的联系,将更多的信息表现出来,同时多样的可视化呈现加入交互动态元素,可提高受众的视觉体验。数据地图、时间线和交互地图是数据新闻最常见的可视化呈现方式。第四,新闻的客观性。不管是传统新闻报道还是数据新闻报道,都强调新闻专业主义,都要遵循客观的报道原则。传统新闻记者虽然努力遵循客观这一原则,但由于传统新闻的生产对记者个人的依赖、数据量的有限性等缺陷,新闻作品不可避免地会受到新闻记者主观因素的制约,另外数据的有限性会对新闻报道的深度和准确性产生一定的影响。与传统新闻报道相比,数据新闻的生产更加注重数据,而不是记者个人,全面、精确的数据对新闻报道的客观性的提高具有重要作用。(三)数据新闻的特性数据新闻在对传统新闻报道模式的变革中,显示出了自己的一些特性。第一,新闻报道的互动性。这种互动不是在新闻报道之后的转发、评论和点赞,而是作品中包含的互动元素。《纽约时报》的数据新闻栏目TheUpshot内容覆盖各个领域,包括政治、体育、经济等,这个栏目的数据新闻生产十分注重数据新闻的交互性。2017年3月30日,《纽约时报》的数据新闻团队使用Redfin,抓取了美国国家房地产经纪公司的房屋价格数据,以及基于斯坦福大学教育数据档案考试成绩的学校质量数据,开发了一套查看学校质量、房价和通勤的图表。以纽约的公共学校为例,图标以城市的公共学校为中心,当读者将鼠标放在图表的不同位置,系统会自动生成一条连接鼠标触点与学校的直线,并且自动显示鼠标触点地区的房价,随着鼠标的移动,房价会实时变化。如果用传统的新闻报道模式对房价与学校的关系进行报道,无疑要阐述大量的数据关系,纯粹的文字或图标会让读者感到厌烦;而数据新闻的交互元素,让读者对房价与学校的关系有一个很直观的认识,读者与图标的互动增强了数据新闻的可读性。第二,数据体量的巨大性。数据新闻的“数据”不仅是指数字,而且是指所有的为生产数据新闻所采集的文字、图片甚至是音频。作为数据新闻另一个优秀的探索者,《卫报》进行了大量的数据新闻报道,其标志性栏目是《数据博客》(DateBlog),其报道内容覆盖政治、经济、体育、战争、灾难、环境各个方面。2017年2月8日,《卫报》制作了一个航空视觉的全球实时空气污染地图,对全球城市空气污染情况进行了报道。《卫报》的数据新闻工作团队分析了危险PM2.5颗粒的数据,并按地区列出了这些数据,以显示欧洲、美国、非洲、亚洲等国家和地区空气最差的城市。为了制作这份地图,他们从世界卫生组织超过2.5微米(PM2.5s)超细颗粒的巨量数据中分析研究,相关城市达数万之多。[8]传统媒体的调查也会涉及相关的数据,这些数据的体量可以靠人工收集和分析,数据量是极其有限的,相比之下,数据新闻需要收集数万条数据,才能洞悉一个行业、一种事物的发展趋势。要想受众对一个行业、事物的发展趋势有一个全面、深刻的了解,就需要巨大体量的数据做支撑。第三,数据呈现的复杂性。数据新闻生产的最后一道流程就是数据的可视化呈现。将大量的数据转化为一张或多张受众能看懂的图表,使得数据新闻的可视化呈现要比传统新闻报道简单的图表呈现更为复杂。这种复杂性不仅包括图表本身视觉理解的复杂性,还包括数据可视化制作流程的复杂性。目前的数据新闻可视化形式包括数据地图、时间线和交互图表,据《纽约时报》的制图总监SteveDuenes介绍,他们希望将巨大体量的数据更快更轻量级地呈现,需要结合大量的文字、图片和图形的设计。数据新闻图形设计部门的成员不仅要会调研,还要懂得写代码、制图,这样才能获得让人惊艳的可视化呈现。[9]《卫报》数据新闻的成名之作是2010年登载的一篇伊拉克战争日志,《卫报》的数据新闻团队将维基解密的数据和谷歌地图结合,将战争伤亡人数标注在地图上,地图可以缩放,这张地图囊括的数据将近40万条。这张地图的制作需要将战争伤亡人员的信息,包括时间和地点,标注在地图上,地点需要输入经度和纬度,并且将信息整理成表单,最后设计并输出地图,整个过程非常复杂。二数据新闻的伦理困境(一)数据新闻与传统新闻报道伦理问题的差异数据新闻和传统新闻报道遵循着一些相同的伦理原则,数据新闻和传统新闻报道必须真实、客观;都要注意保护消息源,避免或减少因报道对消息源造成的伤害;都要避免或减少因报道对报道对象的生活造成负面影响;等等。但是,无论是新闻报道的生产流程、最后的呈现形式,还是新闻的来源与客观性,数据新闻都与传统新闻报道不同,这是数据新闻对传统新闻报道模式的变革。在对传统新闻报道方式进行变革的同时,数据新闻显示了一些不同于传统新闻报道的特点,包括新闻报道的互动性、所使用数据的体量的巨大性和可视化呈现的复杂性。数据新闻与传统新闻报道的差异决定了数据新闻伦理和传统新闻报道的职业道德伦理的差异,本文认为差异主要有以下几个方面。1.传统新闻伦理和数据新闻伦理产生的背景不同传统新闻理论的发展是建立在西方资本主义经济发展的基础之上的,资产阶级办报人标榜出版自由和言论自由,后期廉价报纸出现,报业激烈的竞争使得大量色情暴力等低俗内容出现,为受众所诟病,随后报业垄断时期到来,自由主义新闻理论和社会责任论相继出现。其间,奥克斯、普利策等呼吁新闻伦理,为现代新闻职业道德规范的出现做出了重要贡献。而数据新闻本身在近几年才发展起来,相比传统新闻报道,数据新闻在不多的实践当中逐渐开始树立一些伦理观念。2010年,英国《卫报》利用谷歌地图和维基解密将伊拉克战争的士兵伤亡地点标注在地图上,并在地图上附上伤亡的地点、时间等信息,这则新闻在英国引起轰动并影响了英国的军事计划。2011年,《卫报》运用数据新闻报道伦敦骚乱,用可视化图像标注骚乱发生的地点,并研究了社交媒体在骚乱中的作用。这些出色的报道奠定了《卫报》在数据新闻报道中的标杆地位。除了《卫报》,彭博社、《纽约时报》、《华盛顿邮报》、《泰晤士报》等媒体也制作出了大量的数据新闻报道。但是相关数据新闻报道中对个人信息的使用与公布,引起了很多争议,在这些争议中,数据新闻的一些伦理原则,比如隐私的保护、数据质量等,才慢慢引起人们的注意。2.传统新闻报道伦理甄于成熟,数据新闻伦理还有待确立在古罗马时代,抄送新闻的人要履行忠实的义务,不能随意改写,传送公文的驿站有专门的交接制度,与我国的“两国交战,不斩来使”类似。自古以来,传送信息都要遵循一定的原则。从近代报纸产生至今,经过漫长的实践累积,传统媒体的新闻报道已经形成了一套十分完善的行业规范和伦理准则,这些规范和准则都经历过无数新闻实践的检验。无论是自由主义新闻理论还是社会责任论,都在西方乃至世界新闻史上产生了深远影响。数据新闻则是一种新的新闻报道形式,直到近几年,数据新闻才在西方媒体的实践下繁荣起来,无论是西方媒体还是我国媒体,都缺乏统一的被广泛认可并作为专业规范确立起来的伦理原则。3.数据对新闻伦理失范的影响程度在传统新闻报道中,虽然也会用到一些数据,但大多是一些具体的数值,而且数据的数量十分有限,数据在传统新闻报道中居于次要地位。在传统新闻报道中,新闻采写人员注重分析事件的因果关系;而在数据新闻报道中,数据处于主导地位,无论是新闻报道的采集过程还是呈现过程,数据始终是关键要素。正如舍恩伯格在《大数据时代》中写的那样,在大数据时代,不再探求因果关系,而是注意相关关系。虽然这句话有些夸张,但是可以看出,数据本身注重相关关系。在传统新闻报道当中,数据不处于主导地位,新闻工作人员对新闻事实的专业操作是影响新闻报道法律伦理的重要因素;在数据新闻报道中,如果数据出现错误,那么这篇新闻报道的真实性和客观性就无从谈起。由此可见,数据对数据新闻伦理的影响程度远远大于传统媒体报道中数据对新闻伦理的影响程度。(二)数据新闻面临的伦理困境相比传统新闻,数据新闻对数据的依赖性更高,数据新闻记者借助相关工具,可以轻松获得海量数据。正是因为人们源源不断地生产数据,所以在大数据时代,数据变得唾手可得,数据变得比以前任何一个时期都更加开放。那么,数据新闻记者掌握的数据来自哪里呢?我们如今已经走进了“互联网+”的时代,互联网正在融入我们国家的方方面面,融入了我们生活的方方面面。在教育层面,典型的“互联网+教育”就是慕课,一个老师的课程可以被整个世界的学生所共享。在政务层面,政府的服务环境和办公环境都已经实现了数字化,利用简单的APP或者公众号,民众就能轻易知道政府公布的各项政策。在生活方面,互联网已经与我们的吃穿住行融为一体,我们只要有移动设备和移动网络,就能实现24小时联网。我们就在源源不断地产生数据,数据源于接入互联网的每个人。数据新闻记者通过不断抓取人们产生的数据来生产数据新闻,他们抓取的数据都可以被用来生产数据新闻吗?这些数据被使用之后被怎么处理了呢?他们抓取和使用数据的行为合法吗?这是数据新闻产生面临的一系列的职业道德伦理和法律问题。1.数据的真实性问题数据新闻的真实性和数据的准确性密切相关。数据新闻最核心的部分就是数据,数据新闻的生产是在数据挖掘的基础上,如果挖掘的数据有问题,那么新闻的真实性就值得怀疑了。正如文章的前一部分所说,数据新闻数据的来源主要包括三个方面:一是新闻机构自己采集的数据,二是一些机构的开放数据,三是第三方出售的数据。在赛博空间自己采集的数据一般包括用户社交行为(发微博、博客,点赞,评论等)的数据、购物平台的数据等,这些数据一般需要专业的处理和分析才能达到数据新闻的使用标准,否则这些数据只能是繁杂无序的“脏”数据。一些机构的开放数据,如环保部门、企事业单位公开的数据是经过一定处理的数据,这些数据相对“干净”、有序,具有一定的权威性和公信力,但是由于不是元数据,这些数据难免在公布之前有一定的缺失或者变形。第三方出售的数据一般是由第三方机构的专业团队负责数据的采集和处理,这些数据的准确性难免会受到新闻媒介和第三方机构之间的利益关系的影响。2014年5月,中国社会科学院发布《形象危机应对研究报告2013~2014》,给出了我国每个省份的官员形象排名。中国社科院统计了人民网、新华网和央视网的相关报道,将负面新闻分为贪、渎、色、假、枉,结果显示15.4%负面报道与广东的官员有关,广东官员形象全国最差,给出的原因有三个。第一,负面新闻曝光多,且属地负有社会责任。第二,社会服务管理任务重、难度大。第三,社会治理改革成效欠佳,亟待精细化、人性化。这里的数据在网友中引起了很大的争论,网友认为仅凭人民网、新华网和央视网的相关报道,难以说明广东官员的负面新闻最多,而且这三家媒体全部分布在北京,难免会减少对北京官员的负面报道。网友的质疑是有道理的,中国社科院统计的新闻数据本身有缺失,而且样本的质量也是一个问题。ConstanceTabary、Anne-MarieProvost和AlexandreTrottier对魁北克2011~2013年的数据新闻实践做了一个调查。通过对魁北克六家媒体的数据新闻的相关项目的观察,他们得出结论,虽然这些媒体数据新闻的数量日益增长,但是这些数据新闻的增长并没有对数据新闻记者的专业技能起到很大的提升作用,阻碍魁北克数据新闻质量提升的主要因素之一就是政府提供的数据质量不高。[10]数据新闻要求数据新闻记者必须具备相应的数据处理技术,比如爬虫技术和数据可视化技术,甚至是设计编程技术,这对普通的记者来说是一种挑战。理想的数据新闻记者要求同时具有新闻记者和数据分析师的能力,但是在我国当前的新闻教育背景下,新闻记者很少有人能做到专业的数据分析,即使通过自学能够进行相关分析,但是也缺乏专业性。数据新闻的数据挖掘、处理与可视化呈现一般由专业的数据分析师操作,数据分析师如果不具备一定的新闻素养,可能导致数据和新闻相分离的情况,数据背后的新闻信息不能很好地被呈现出来。数据新闻记者比较注意事物的因果关系,数据分析师可能更加注重事物的关联。比如,《南方都市报》编委联席委员韦中华提到,2015年7月德国总理默克尔在清华大学演讲时,《南方都市报》回溯了2000年以来在中国高校做过演讲的外国领导人。其中南都在“学生最爱问什么”一图中特意标注“一些学院会先收集学生想问的问题,最终选出提问者”,因为历年外国领导人在高校演讲,学生问的问题都相差不大,都是台湾问题或者南海问题。如果不加以背景说明,很容易给人以中国高校大学生没有创意的印象,所以南都记者对这一统计数据特地加以说明。[11]2.数据新闻的客观性问题相比传统新闻对人的能动作用的强调,数据新闻更加强调数据,数据本身是客观的,那么依靠数据做出来的数据新闻就是客观的吗?答案是否定的。做出过《中国高官迁徙调动图》(《南风窗》)、《还有多少官员独董》(《南方周末》)、《解密各省法院院长背景》(《南风窗》)、《公交车公共安全事件调查》(《南风窗》)、《数据说:中国恐怖袭击到底多严重》等数据新闻的图政数据研究室创办人黛玉曾经说过,数据呈现的环节要求提前构思出文字、图表等在内的呈现方式,甚至提前做好版面,依据新闻构建出指标。新闻的本源是事实,事实在前,新闻在后。但是由于新闻报道的时效性要求,数据新闻需要快速采写,一些事实发生后的采写环节被人为迁移,人的本质是社会关系的集合,这样报道出来的新闻难免会带有先入为主的主观色彩。[12]另外一个例子是《南方周末》在2014年春节前联合环保组织发起的“回乡测水”活动。他们首先征集志愿者,让志愿者用他们发放的测量工具测量家乡所在地的地表水水质,然后统计相关数据,最后他们统计了20个省份的35组饮用水和12组地表水的水质。这其中就有一个问题,这些志愿者有大学生、医生,也包括一些农民工、环保人员,实际上,他们对测量工具的使用是否科学直接影响到测量结果,这些都是人的因素对数据的客观性造成的影响。3.信息隐私安全问题首先,明确一个概念,什么是信息隐私?信息隐私,作为隐私权的一部分,是人们对与其个人身份、生活状况等相关的各类信息的一种自决权;包括一般个人信息与敏感个人信息(张新宝,2015;王利明,2013)。信息隐私分为两个维度,一个是无差别的一般个人信息,比如,北京市的交通运行图,这里面就是大量无差别的个人信息,大家不能识别每个具体人的出行信息,但是可以知道整个朝阳区一天内人们乘车出行的轨迹。那么,这类信息需要保护吗?是隐私吗?另一个是我们特别关注的敏感的个人信息,比如我们个人的就医经历、情感生活等,涉及每个人不愿意公开的敏感信息。信息隐私是一个具有这两个不同维度的概念。实际上,稍加回顾,我们知道,整个人类对隐私这个概念的界定,主要经历了三个过程:一个是私密生活;一个是独处的权利;一个是发展到今天的个人信息自觉权,即个人在什么情况下,愿意表露并能够控制自己个人信息的权利。英国已经有法律守则规定与“隐私”相关的信息是不允许被泄露的,守则还规定负责主要政策和财政动议权的高级员工才与公共利益相关,而不是没有什么权力的普通员工,也就是说,只有和公共利益相关的主要人物的薪资信息才是允许被公布的。[13]个人在什么程度上愿意表露自己的信息?表露在互联网上的个人信息,虽然是公开的,但是他人,或者媒体等其他组织机构有利用、组合和再公开的权利吗?一旦有媒体组合了这些个人信息,并成为他人可识别的信息,有人利用它识别到了自己,并有可能影响到自身的生活时,是否算侵犯隐私?媒体要不要承担相关责任?数据新闻报道的信息隐私安全问题,主要包括两个方面:一个是使用可公开获得的数据,数据新闻报道是否会侵犯信息隐私?另一个是使用组合、关联、挖掘出的数据,数据新闻报道是否会侵犯信息隐私?2012年12月23日,美国隶属于纽约州白原市(WhitePlains)的地方媒体JournalNews在其纸媒和官网上发表了文章《隔壁的持枪者:你所不知道的家附近的武器?》(Thegunownernextthedoor:Whatyoudon'tknowabouttheweaponsinyourneighborhood)的数据新闻。之所以报道这个话题,是因为12月14日在美国康涅狄格州纽敦镇桑迪·胡克小学发生了一起致28人(包括20名儿童)死亡的校园枪击案。康涅狄格州紧邻纽约州,发生如此重大的枪击事件,自然引起地方公众和媒体的关注。JournalNews的记者运用从官方获得的数据,通过交互地理信息图展示了美国纽约市北Westchester、Rockland和Putnam三郊县33614名合法持枪者的名字与住址,以警醒公众注意枪支使用的安全。然而,报道引发了公众的强烈不满,受到了《纽约时报》《卫报》等媒体的批评,认为侵犯了持枪者的个人信息隐私安全,甚至有可能影响地方治安。持枪者认为,通过这张地图,不法分子可以轻易找到他们,趁其不在家时偷走枪支去作恶,报道效果适得其反。也有公众认为,不法分子也许会按图索骥专门侵犯那些没有枪支保护的家庭。政府认为,这样大范围公布持枪者信息,有可能导致当地居民恐慌,迫使人们移居到没有枪支的地方生活。该报道的记者和编辑也很困惑,他们根据自由信息法(FreedomofInformationAct)使用的是公开数据源,为什么不可以报道?新闻言论自由和隐私保护之间的边界到底在哪里?类似的还有第二个案例。2013年2月20日英国《伯明翰晚报》在其网站上刊登了一篇“Citycouncilspends1£monbedandbreakfastroomsforBirmingham'shomeless”的报道,意在调查市政府每年救济无家可归者的花费情况。报道不仅详尽公布了1~12月政府每月救助无家可归者的花费,还提到了1位被救助者的名字,并公布了政府为救助者提供饮食和住宿的旅馆名称、照片和位置。有学者质疑,这是侵犯个人信息隐私安全的行为;公开被救者的个人信息和旅馆名称,容易给他们带来伤害。在这里还有一个问题,与西方社会不同,中国的传统文化崇尚“事无不可对人言”,“君子坦荡荡,小人长戚戚”。长期以来对隐私不但不受重视,而且比较避讳,总认为它是不好的,或者不光彩的事情。甚至在20世纪七八十年代,国人还多将隐私视为“阴私”,认为它是隐匿于家庭或者人际关系之间的“男女间不便公开、有伤风化的事情”(金信年,1982)。在西方,尤其是欧洲,对基于个人信息隐私的保护非常严格,甚至将其视为基本的人权。这是两种不同的取向。现在我们面临的严峻问题是,在大数据时代个人信息被频繁利用再组合的情况下,一旦媒体需要使用个人信息进行报道,该怎么做?再看第三个案例。2011年9月,《堪萨斯明星报》(KansasCityStar)有一篇旨在揭露那些曾有过医疗事故的医生,却在注册登记时无显示的报道(Badmedicine:Doctorswithmanymalpracticepaymentskeepcleanlicenses)。这是一则典型的通过对个人信息挖掘重组后,产生信息隐私安全问题的报道。报道通过比对保健医生数据库信息与记者深访获得的数据,搜集到了21位医生执业生涯中曾出现过医疗事故,有的还是非常严重的医疗事故,而目前的注册中没有显示。记者将搜集到的零星的个人信息,组合在一起,告诉读者,在你周边有哪些曾经有过医疗事故的医生,而这些你或许并不知情,或许根本查不到。这当然引起了医生的强烈反对,拿过去的情况说事,侵犯了其隐私权。这一论争,类似近年来热议的“被遗忘权”(therighttobeforgotten)。对过去和现在个人信息的重组、挖掘而可能产生的侵犯个人信息隐私安全问题,该如何解决?4.数据的保护与国家利益的冲突一些新闻机构,尤其是外国的新闻机构,十分注重对消息源的保护。在数据新闻里,每个人的信息数据就是数据新闻的消息源,对数据的保护就是对数据新闻消息源的保护。个人数据也分为直接相关数据和间接相关数据,直接相关数据就是可以直接识别个人身份的数据,比如个人的身份证号、个人的肖像;间接相关数据就是无法直接识别个人身份的数据,比如年龄、职业、种族。但是多个间接相关数据的组合可能也会将个人身份精确识别。藏在一些文件里面的元数据,比如上网入口或者其他的数据,可以被用来锁定泄露这些数据的人,即使一些印刷品也有一些非显性的印记,利用这些信息甚至可以找出是哪种机器在印刷它们。[14]尽管有一些法律条例要求对个人信息进行保护,事实上,很多数据泄露、数据分享和一些无可预料的问题没有得到有效解决。[15]大数据时代的信息隐私安全问题,与整个社会发展相关。“精准性的目标使得传播媒介在投放原生广告时,必须通过大数据平台进行用户数据的采集和分析工作,然而大量的数据挖掘、分析过程使得用户数据的利用和保护更加困难,甚至出现了主体行为过程中的‘失范’困境,用户隐私无法有效得到保护。”[16]之前,FBI要求苹果公司为特定手机解锁,原因是美国发生了一起恐怖袭击案,一个枪手杀了很多人,FBI对犯罪嫌疑人进行调查时查到一部苹果手机,但是犯罪嫌疑人设置了安全密码,导致FBI无法得到相关信息,而且苹果手机的保密功能十分强大,稍有不慎数据可能自动销毁。美国法院命令苹果公司提供相关软件以破解苹果手机的加密程序,但是民众认为,FBI可以用这个软件来获得恐怖分子的相关信息,也可能泄露公民个人信息,于是这个案件引发了全世界范围的讨论。如今,我们越来越多需要个人信息进行经济生产。具有规模性、多样性、高速性与价值性的大数据,已成为直接的社会财富与资源,公私领域对其需求高涨。这是一个很现实的问题。不仅企业或者政府需要分享和利用个人信息,我们每个个体也需要。比如,我们在朋友圈不断地晒幸福,通过自我表露个人信息进行人际沟通,这是我们的个人身心发展的意愿和需求。对于个人来说,我们既想表露个人信息,又想一定程度地维护我们信息的安全。对于政府和信息产业者而言,比如苹果和BAT这样的公司,它们既是个人信息的收集者和使用者,又是负有保护个人信息隐私安全的义务的履行者。尤其是政府,在个人数据保护中,既是裁判员,又是运动员,如何平衡和监管?当个人信息保护与国家利益产生冲突,掌握个人数据的机构该怎么办?这些都是难题。5.数据新闻行业规范的滞后性这种滞后性体现在两个方面。第一是缺乏对非专业新闻工作者(如程序员、图形设计者等)的职业道德伦理规范,传统新闻报道在其悠久的发展历史中已经确立起一套完备的行业规范,包括伦理道德规范和法律规范,对传统的新闻工作人员起到了很好的规范和示范作用。目前,数据新闻的生产要求相关从业人员有良好的计算机科学素养,比如采集数据的能力、分析数据的能力、数据可视化的能力。由于传统媒体的新闻工作者普遍缺乏相关专业背景,媒体不得不聘用大量计算机专业人员加入数据新闻的生产过程中,比如数据新闻的程序员、图形设计人员。传统新闻的职业道德伦理规范都是针对专业的新闻从业人员,那么对这些在数据新闻报道中起技术支撑作用的从业人员该怎么规范?清华大学的陈昌凤教授认为,为了确保所收集信息的可靠性与真实性,我们需要从人文角度对这些信息进行考量,“当数据新闻蓬勃发展之时,数据素养的功能也开始凸显,即强调对数据的批判思维以及清晰表达数据资讯的能力”[17]。第二是有关数据使用法律建设的落后。2015年12月,历经波折,欧盟终于通过了号称严苛的数据保护规定——《一般数据保护条例》(GDPR),而这个规定是早几年就提出的,尽管如此,欧盟成员国需要再将此条例转化为本国法律,条例才能得以实施,这也需要一个过程。据中国信息通信研究院发布的《大数据白皮书(2016)》介绍,从国内来看,我国数据法律化还比较薄弱,现行的法律法规仅有《政府信息公开条例》和《最高人民法院关于审理政府信息公开行政案件若干问题的规定》的司法解释有所涉及。三风险规避:数据新闻伦理困境的应对策略数据新闻面临的伦理问题和传统新闻有相同之处,它们都面临着新闻的真实性与客观性的考验,都可能陷入对新闻源的保护和维护国家利益的冲突之中。这些相同的伦理原则里面也蕴含着不同的内涵。传统新闻报道的真实性表现在新闻报道的要素要真实,包括人物、事件、地点、原因等。数据新闻的真实性主要指的是数据的准确性,使用“干净”的数据是保证数据新闻准确性的前提。传统新闻的客观性原则是与新闻从业人员的主观意志相对立的,强调应该不加入个人意志,报道新闻事实的本来面目,这一点与数据新闻的客观性要求是相同的,但是数据新闻的客观性更强调数据的客观性,对数据的使用应该全面,这是数据新闻工作者应该更加深入考虑的问题。传统媒体对新闻源的保护大多数情况下指的是对“深喉”的保护,数据新闻则强调对存储的数据的保护,人的因素并不多。既然数据新闻面临新的伦理,我们需要针对这些新出现的问题提出相应的应对策略,本文认为可以从以下几个方面着手。第一,数据的采集必须按照相应的规则,采集“干净”数据;数据新闻工作者应该兼具新闻素养和数据处理能力。数据新闻的真实性和客观性建立在数据本身的准确性和数据新闻工作者对新闻客观性原则的坚守上。要保证数据新闻的真实性,需要按照规则采集数据,这些规则包括以下几个。①完整的数据,数据的基本元素应该具备,不能丢失。②具有时效性的数据,所采集的数据不能是已经发生很大改变的、与现实情况相去甚远的过期数据。③正确的格式,要保证数据格式的正确,数据单位不能缺失。④按照数据的分类采集数据,将数值、文字、图片等分开采集。要保证得到“干净”的数据,数据新闻工作者必须具备相关的数据处理能力,而这些能力往往是专业的新闻工作者所欠缺的,为此,这些新闻工作者要增强数据处理能力,了解数据采集规则,弥补数据处理能力的缺陷。第二,对数据的选择,需要坚持“公共利益原则”和“知情同意原则”。数据新闻采集的大量数据如果处理不当,可能泄露个人隐私,侵犯人们的隐私权;数据乃数据新闻的新闻源,新闻源在某些情况下需要被保护,这可能与国家利益相冲突。为此,在进行数据新闻报道的时候,数据运用、分析与呈现要基于公共利益。为了公共利益,我们可以深度挖掘这些信息,比如利用海量数据来对恐怖分子进行定位。在苹果解密软件案件中,美国法院最终判决苹果公司解锁恐怖分子的手机。而如无必要,报道中不能详尽展示可识别的个人信息。数据信息是否服务于公共利益,与媒体的社会责任紧密相关,数据新闻经常被质疑的一个例子就是难道因为被允许的持枪者的数据是公共数据就能被放在网上展示出来吗?不能仅仅因为是公共数据就能被公开展示。持枪者的数据应该被放在其他数据库中使其更有意义,服务于更大的新闻议题。[18]所谓知情同意原则,就是我们在使用数据进行报道时,应征得数据持有者或者个人信息持有者的同意。随着开放数据的普及和算法的改进,媒介机构使用个人信息的成本大大降低,由于采集的数据体量的巨大,取得个人同意再使用其数据信息基本不可能做到,但是这并不意味着个人就没有相关的知情权,在使用他人极具隐私性的数据信息时,一定要取得相关人的

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论