美国白宫:年全球大数据白皮书44_第1页
美国白宫:年全球大数据白皮书44_第2页
美国白宫:年全球大数据白皮书44_第3页
美国白宫:年全球大数据白皮书44_第4页
美国白宫:年全球大数据白皮书44_第5页
已阅读5页,还剩40页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、美国白宫:20144年全球”大数据“白皮书(浙江大大学译)Posteed onn 20114年055月29日日 by oooddong in 数数据行业, 行业资资讯 wiith 00 Commmentts大数据:抓抓住机遇、保存价值值美国总统行行政办公室室2014 年 5 月概述:“即使大数数据技术重重塑了我们们周围的世世界,今天天的发言也也将帮助我我们持续贯贯彻自身的的价值观念念。”“这份评评估报告本本质上被认认为是一种种对大数据据作用范围围的调查。在过去的的 90 天中,评评估小组对对学术专家家、产业代代表、保护护个人隐私私的倡导者者、人权团团体、执法法者,以及及其它政府府机构进行行了调

2、研。白宫科学学与技术政政策办公室室(Whiite HHousee Offfice of SSciennce aand TTechnnologgy Poolicyy)与麻省省理工大学学、纽约大大学、加州州伯克利大大学联合组组织了三场场大学会议议。”“在 22014 年,美国国国税局通通过一个名名为Get trannscriipt的工具将将纳税人的的信息数据据加以共享享,纳税人人可以通过过它获得他他们自己最最近三年的的纳税记录录。个人纳纳税者可以以借此下载载过去的纳纳税申报单单,这使得得居民进行行抵押、学学生贷款、商务贷款款等活动与与填写纳税税表变得更更加便捷。”“尽管医学学技术不断断变化,但但健

3、康数据据仍然是我我们生活中中非常私密密的部分。在大数据据使得较之之以往任何何时候都更更为强大的的发现成为为可能的同同时,重新新审视相关关信息被所所有医疗保保健机构共共享后的隐隐私保密方方式也显得得相当重要要。医疗保保健行业的的领导者已已经呼吁构构建一个更更为广泛的的信用框架架,使得不不同来源、不同隐私私保密程度度的健康数数据得以汇汇聚。这一一框架需要要附加健健康保险便便利和责任任法案与与反基因因歧视法(“Geneetic Infoormattion Non-Disccrimiinatiion AAct”, GIINDA)中的隐私私保护条款款,并同时时设计标准准化数据结结构以提高高其跨平台适适应

4、性。 ”“大数据正正在改变世世界。但是是它并没有有改变美国国人对于保保护个人隐隐私、确保保公平或是是防止歧视视的坚定信信仰。这份份调查报告告旨在鼓励励使用数据据以推动社社会进步,特特别是在市市场与现有有的机构并并未以其他他方式来支支持这样的的进步的领领域,与此此同时,我我们也需要要相应的框框架、结构构与研究,来来帮助保护护我们的核核心价值观观念。给总统的一一封信亲爱的总统统先生:我们正生活活在社会、经济与技技术革命之之中。我们们如何通信信、交际、度过闲暇暇时光以及及开展业务务已经转移移到了互联联网上。互互联网又渗渗透进入我我们的手机机,进入蔓蔓延在我们们家园和城城市中的设设备中,进进入推动工工

5、业经济的的工厂中。其导致的的数据爆炸炸和挖掘正正改变着我我们的世界界。今年一月,你你要求我们们进行为期期 90 天的调查查,检验大大数据将如如何改变我我们生活和和工作的方方式,改变变政府、公公民、企业业家和消费费者之间的的关系。这这次调查的的重点在于于公共和私私营部门如如何在将风风险最小化化的同时,将将大数据的的价值最大大化。 它它也为大数数据确定了了发展我们们的经济,改改善健康和和教育以及及使我们国国家更加安安全和节能能的机会。虽然大数数据毫无疑疑问地加大大了政府权权力累积未未经核实的的事实的可可能性, 但它也提提供了增强强公众责任任、 隐私私和权利的的方案。如如果正确实实施, 大大数据将成

6、成为历史前前进的推动动力,帮助助我们国家家保持长期期以来成为为我国特点点的公民和和经济活力力。大数据技术术将变革生生活中的每每一个领域域。 它们们使之成为为可能的知知识发现提提出了我们们为隐私保保护构架的的框架如何何在大数据据生态系统统中应用的的重大问题题。大数据据也引发了了其他问题题。 这个个报告的一一个重大发发现在于,大大数据分析析有一定可可能使长久久存在的公公民权利保保护黯然失失色,特别别在于个人人信息如何何利用于住住房、信贷贷、就业、健康、教教育及市场场领域上。美国人与与数据的关关系将扩展展他们的机机会和潜力力,而不是是缩减。我们正在建建设我们将将继承的未未来。 美美国比世界界上的任何

7、何其他国家家更适合确确保数据革革命能够持持续地为个个人发展和和社会良好好效力。我我们欣然提提交本报告告,建议我我们如何在在保护诸如如隐私、公公正、自决决等基本价价值的同时时拥抱大数数据技术。我们致力力于这一倡倡议和改进进。我们今今天在这发发起的对话话将帮助我我们在大数数据重塑我我们周围世世界的同时时,坚持我我们自身的的价值。目录1、大数据据与个人什么是大数数据?大数据有什什么不同?证明我们的的价值2、奥巴马马政府在数数据开放与与隐私保护护问题上的的发展路径径奥巴马政府府关于公开开数据的举举措美国隐私法法案和国际际隐私法框框架3、公共部部门的数据据管理大数据与医医疗保健服服务对学习的研研究:大数

8、数据与教育育大数据在国国土安全部部在执法过程程中贯彻隐隐私价值观观大数据技术术对隐私法法的启示4、私营部部门的数据据管理大数据对消消费者与企企业的益处处广告支撑的的生态系统统数据服务业业5、为大数数据构建的的政策框架架大数据与公公民大数据与顾顾客大数据与歧歧视大数据与隐隐私预测大数据据变革的下下一篇章6、结论与与建议保护个人隐隐私的价值值数字时代负负责任的教教育创新大数据与歧歧视执法与安全全保护数据公共资资源化1、大数据据与个人什么是大数数据?自从古代有有过第一次次计数和农农作物产量量记录以来来, 数据据收集和分分析便成为为社会功能能改进的根根本手段。 17、 18 世纪的微微积分、概概率论和

9、统统计学所提提供的基础础性工作,为为科学家提提供了一系系列新工具具,用来准准确预测星星辰运动、确定公众众犯罪率、结婚率和和自杀率。这些工具具常常带来来惊人的进进步。在 19 世世纪,约翰翰斯诺(JJohn Snoww)博士运运用近代早早期的数据据科学绘制制了伦敦霍霍乱爆发的的“群聚”地图。霍霍乱在过去去被普遍认认为是由“有害”空气导致致的,斯诺诺通过调查查被污染的的公共水井井进而确定定了“霍乱”的元凶,并并同时奠定定了疾病细细菌理论的的基础。从数据中撷撷取洞见以以提振经济济行为,这这也是美国国工业的惯惯常做法。弗雷德里里克温斯洛泰勒(FFredeerickk Winnsloww Tayylor

10、)在宾夕法法尼亚州的的米德瓦尔尔钢铁厂采采用秒表和和笔记板来来分析生产产力,这大大大增加了了车间产量量,也铸就就了他的信信念,即数数据科学可可以为生活活中每一个个方面都带带来革命性性影响。1911 年,泰勒勒撰写了科学管理理原理,以以回应西奥奥多罗斯福(Theoodoree Roooseveelt)总总统有关提提升“国家效能能”的倡议:从我们单个个人的行动动到大型企企业的工作作,科学管管理的基本本原理可以以应用到一一切类型的的人类行为为中无论何何时,只要要正确运用用这些原理理,必定会会产生真正正令人惊讶讶的成果。今天,数据据比以往任任何时候都都更加深入入地与我们们的生活交交织在一起起。我们期期

11、待着用数数据解决各各种问题、改善福利利,以及推推动经济繁繁荣。数据据的搜集、存储与分分析技术不不断提升,这这种提升看看上去正处处于一种无无限的向上上轨迹之中中。它们的的加速是因因为处理器器能力的增增强、计算算与存储成成本的降低低,以及在在各类设备备中嵌入传传感器的技技术的增长长。 20011 年年,新生成成的和复制制的信息量量估计超过过了 1.8 ZBB(泽字节节);而在在 20113 年,这这一数字估估计可达 4 ZBB。什么是泽字字节(ZBB 或 ZZettaabytee)一泽字节等等于 211 字节,或或相应的信信息单元。想想看,一一个字节等等于文本中中的一个字字符。 11ZB 相相当于

12、存储储 3233 兆份列列夫托尔斯泰泰所著的 12500 页的战争与和和平所需需的容量。6或者想想象一下,假假定每一个个美国人每每秒钟拍一一张照片并并连续拍 1 个月月,所有这这些照片存存储进来容容量就相当当于 1ZZB。世界上每天天大约有 5 亿张张照片上传传或分享,另另外每分钟钟还有超过过 2000 小时的的视频上传传、分享。但是,即即使是人们们自己产生生的信息,即即从语音通通话、电子子邮件、文文本到上传传的图片、视频、音音乐等全方方位交流产产生的信息息,与每天天产生的与与他们相关关的电子记记录等数字字化信息相相比,在数数量上都是是相形见拙拙的。这些趋势还还将持续下下去。我们们只是处在在所

13、谓的“物联网”(“Inteernett of Thinngs”)的相当当初级的阶阶段。在物物联网中,我我们的各种种应用设备备、运输工工具以及持持续增长的的“可穿戴”技术产品品将可以彼彼此交换信信息。技术术的进步将将促成创建建、捕捉、管理与存存储信息的的成本降至至20055 年的六六分之一。自 20005 年年以来,人人们在硬件件、软件、人才与服服务方面的的商业投资资增长了近近 50%,达到 4 万亿亿美元。“物联网”“物联网”这个术语语用来描述述具有可交交换信息能能力的设备备网络。这这些设备通通常嵌入了了传感器,并并通过有线线或无线网网络连接后后进行彼此此间的信息息交换。它它们可能包包括你的温

14、温控器、汽汽车,甚至至是你咽下下去的“小药片”,医生可可以用它来来监控你的的肠胃以及及消化道的的健康状况况。这些连连接的设备备通过互联联网传输、编制和分分析数据。关于“大数数据”有许多种种定义,这这种差别取取决于你是是一位计算算机科学家家,还是一一位金融分分析师,抑抑或是一位位为风险投投资人推销销一个概念念的企业家家。多数定定义都反映映了那种不不断增长的的捕捉、聚聚合与处理理数据的技技术能力,而而这个数据据集在数量量、速率与与种类上持持续扩大。换言之,“现在,数据可以更快获取,有着更大的广度和深度,并且包含了以前做不到的新的观测和度量类型。”7更确切地说,大数据集是“庞大的、多样化的、复杂的、

15、纵深的和/或分布式的,它由各类仪器设备、传感器、网上交易、电子邮件、视频、点击流,以及现在与未来所有可以利用的其他数字化信号源产生” 。就大数据而言,真正重要的是它能做什么。先且不论我们如何把大数据界定为一种技术现象,大数据分析那多元而广阔的潜在用途将面临一些关键性的问题,即我们的法律、伦理与社会规范在大数据时代是不是有足够的能力保护个人隐私和其它价值。前所未有的计算能力与持续的改进能力为我们的生活带来了可能是先前从未预料到的发现、创新与进步。但是,这些能力对于普通消费者来说,多数都是既不可见,也无法得到的,因此, 它们在持有大数据的一方与有意无意地提供着数据的一方之间,形成了一种非对称的力量

16、。部分挑战也也在于如何何理解大数数据发挥作作用的许多多不同的应应用场景。大数据可可以被看成成一种资产产、一种公公共资源,或或者一种个个体身份的的表达; 它的应用用或许可以以驱动未来来的美国经经济,也可可以是我们们所珍视的的自由的一一种威胁。大数据可可能是所有有这些事情情。就这为为期 3 个月的研研究而言,评评估组并不不旨在对大大数据的作作用做出全全面的解答答。大数据据技术和支支撑它的产产业都在不不断地创新新和变化中中。相反,我我们的研究究集中在探探讨个人与与数据的搜搜集、利用用方之间那那些至关重重要的问题题。这份评估报报告的范围围今年 1 月 177 日, 奥巴马总总统在司法法部就改革革美国信

17、号号情报工作作的演讲中中,责成他他的顾问约约翰波德斯塔塔(Johhn Poodestta)就大大数据技术术正在或将将要对经济济、社会与与政府行为为的范围内内发生的影影响做出全全面评价。为此,波波德斯塔召召集了商务务部部长佩佩尼普利茨克克(Pennny PPritzzker)、能源部部部长欧内内斯特莫尼兹(Erneest MMonizz)、总统统科学顾问问约翰霍尔德伦伦(Johhn Hooldreen)、总总统经济学学顾问杰弗弗里泽恩斯(Jefffrey Ziennts),以以及其他高高级政府官官员。总统统科学和技技术顾问委委员会(PPresiidentts Coounciil off Advv

18、isorrs foor Scciencce & Techhnoloogy, PCASST)组织织了一项平平行报告,以以评估基础础技术。他他们的成果果支持了本本报告中的的许多技术术性判断。这份评估报报告本质上上被认为是是一种对大大数据作用用范围的调调查。在过过去的 990天中,评评估小组对对学术专家家、产业代代表、保护护个人隐私私的倡导者者、人权团团体、执法法者,以及及其它政府府机构进行行了调研。白宫科学学与技术政政策办公室室(Whiite HHousee Offfice of SSciennce aandTeechnoologyy Pollicy)与麻省理理工大学、纽约大学学、加州伯伯克利大学

19、学联合组织织了三场大大学会议。白宫科学学与技术政政策办公室室也发放了了“咨询请求求”,就大数数据和个人人隐私问题题寻求公众众意见,并并得到了超超过 700 起回复复。此外,白白宫网站平平台就公众众对于大数数据的各类类使用及不不同类型的的大数据技技术所持的的态度,做做了一项粗粗略的调查查。在本报报告附录中中,可以看看到工作组组各项工作作的列表。大数据有什什么不同?这章首先界界定一下大大数据真正正新颖和不不同的是什什么,它得得益于总统统科学和技技术顾问委委员会(PPCASTT)的工作作。PCAAST 写写作了一份份平行而独独立的报告告大数据据与个人隐隐私:一种种技术的视视角。“3V”: 数量(VV

20、olumme)、类类别(Vaarietty)、速速度(Veelociity)为了本项研研究,评估估小组聚焦焦的是那些些数量巨大大、类别繁繁多且高速速运行的数数据,而传传统的数据据采集与分分析模式已已经难以应应对了。我我们将其特特征通俗地地称为“3V”。数据采采集、存储储与处理成成本的下降降,连同像像传感器、相机、地地理位置及及其它观测测技术提供供的新的数数据来源,意意味着我们们生活在一一个数据采采集几乎无无处不在的的世界中。采集与处处理的数据据量是空前前的。从基基于网络的的应用、可可穿戴技术术与先进传传感器到监监测生命体体征、能源源使用状况况与慢跑者者跑步速度度的监测仪仪,由此带带来的数据据爆

21、炸将推推进人们对对于高性能能计算技术术的需求,并并推动针对对最复杂数数据的管理理能力的提提升。不仅是数据据的数量正正在快速增增长,它的的格式也越越发多样,来来源也越发发广泛。就就像总统科科学和技术术顾问委员员会的报告告中所说的的,有些数数据是“天生数字字化的” (“bornn diggitall”),意思思是说它就就是特别创创造出来用用于计算机机和数据处处理系统的的。 这些些例子存在在于电子邮邮件、网页页浏览,或或 GPSS 定位之之中。其它它数据是“天生模拟拟的” (“bornn anaalog”),这是是说它从物物理世界中中发散出来来,但可以以不断被转转化成数字字格式。模模拟数据的的例子包

22、括括手机、相相机或摄像像设备录制制的语音或或可视信息息,或者还还有通过可可穿戴设备备监测到的的身体活动动数据,如如心率或排排汗量。“数据融合合”(“dataa fussion”)能够将将分散的数数据源整合合在一起,随随着这种能能力的提升升,大数据据可以带来来一些远见见卓识。大数据来源源是什么?数据的来源源与格式,连连同其类别别与复杂程程度,都处处于持续增增长之中。 部分数数据来源如如下: 公公众网络;社交媒体体; 移动动应用程序序;联邦、州和地方方记录与数数据库;聚聚集商业交交易与公共共记录中的的个人数据据而形成的的商业数据据库;地理理空间数据据;各类调调查;通过过扫描并借借助光学字字符识别转

23、转化而成电电子形式的的传统离线线文献。更更多具有上上网功能的的设备与传传感器的出出现扩大了了从物理实实体,包括括通过传感感器和射频频识别(rradioo-freequenncy iidenttificcatioon, RRFID)芯片采集集数据的能能力。而个个人定位数数据则来自自 GPSS 芯片、移动设备备蜂窝信号号基站的三三角测量、无线网络络映射,以以及个人支支付行为。不仅如此,数数据采集与与分析的执执行速度越越来越接近近即时时间间,这意味味对于一个个人就其周周边环境或或生活所做做的决定产产生即时的的影响而言言,大数据据分析有着着越来越大大的潜力。高速数据据的例子包包括记录使使用者在线线与网

24、页互互动活动的的点击流数数据,即时时追踪定位位的移动设设备获得的的 GPSS 数据,以以及得到广广泛分享的的社交媒体体数据。客客户与公司司希望通过过分析这种种数据使其其即刻获益益的要求越越来越高。事实上,如如果手机定定位应用不不能即时准准确地确认认手机位置置,它根本本就不会有有什么用处处,并且,在在确保我们们的汽车安安全运行的的计算机系系统中,实实时操作就就至为关键键了。新机会、新新挑战大数据技术术能够将大大量的数据据集以从前前不可能的的方式分析析出有价值值的东西。的确,部部分大数据据所能产生生的卓见是是研究者过过去从未敢敢想过的。但是,有有关大数据据的技术能能力已然达达到了成熟熟与普及的的水

25、平,它它要求我们们思考如何何努力在大大数据提供供的机遇与与这些技术术所带来的的社会、伦伦理问题之之间做出平平衡。大数据应用用的威力与与机遇若使用得当当,大数据据分析能够够提高经济济生产率,改改善客户与与政府服务务体验、挫挫败恐怖分分子并且拯拯救生命。例如:大数据与不不断发展的的“物联网”使得人们们将产业经经济与信息息经济进行行整合成为为可能。喷喷气式发动动机和运货货卡车现在在能够装配配许多传感感器以监控控上百个数数据点,并并且在需要要维护时自自动报警。这就使得得整个系统统更加扁平平化,减少少了维护成成本,并同同时增强了了安全性。医疗保险和和医疗补助助服务中心心(Thee Cennterss f

26、orr Meddicarre annd Meedicaaid SServiices, CMSS)已经开开始在要求求支付前用用预测分析析软件来标标示看似报报销欺诈的的凭据。欺欺诈预防系系统有助于于实时甄别别高风险医医疗保健提提供者的欺欺诈、浪费费与滥用行行为,它已已经终止、阻止或确确认了 11.15 亿美元的的欺诈性支支付,在该该程序上头头一年花的的每 1 美元带来来了 3 美元的成成本节约。在阿富汗战战争最激烈烈的那几年年,美国国国防高级研研究计划局局(Deffensee AdvvanceedRessearcch Prrojeccts AAgenccy, DDARPAA)派遣了了数据科学学家团

27、队和和可视化技技术团队到到战地。在在一个名为为 Nexxus 77 的计划划中,这些些团队被直直接派进作作战部队,用用他们的工工具帮助指指挥官解决决特定的作作战计划。在其中一一个地区,NNexuss 7 的的工程师将将卫星数据据和监测仪仪数据融合合, 观察察交通工具具是如何在在道路网中中流动,这这使其更容容易定位并并摧毁简易易爆炸装置置。有一个大数数据研究综综合了通过过监测器采采集的数百百万个来自自新生儿重重症监护病病房的数据据样本,以以确定哪些些新生儿有有可能感染染了潜在的的致命性传传染病。通通过分析所所有数据(不不只是医生生在他们的的巡视中标标记的) ,该项目目能够识别别像体温升升高、心率

28、率加快这样样的因素,以以此作为有有可能发生生了某种感感染的早期期预警信号号。这些早早期感染信信号并不是是经验丰富富、工作细细致的医生生通过传统统方式能够够了解到的的。大数据技术术也具有其其它极大的的前景,它它可以用来来更好地管管理电网间间的调配需需求、 改改进能效、为发展中中国家提高高农业生产产力,以及及预测传染染病的传播播等许多其其它的应用用领域。大海捞针现在,计算算能力要做做到“大海捞针针”不仅是可可能的,而而且依然成成为现实。过去,搜搜索多个大大数据集既既需要合理理组织数据据,也需要要提出特定定的研究问问题,依赖赖选择对的的查询以返返回正确的的结果。大大数据分析析令数据科科学家积聚聚了海

29、量数数据,包括括非结构化化数据,并并且使他们们能够找出出异常点与与数据模式式。在这种种发现的模模式中,为为了找到针针,你得有有个大海;为了获得得确定的洞洞见,你需需要一定量量的数据。而在其中中所涉及的的巨大数据据量内,就就隐含了对对于个人隐隐私的关键键性挑战。例如,Brroad 研究院的的基因研究究人员发现现,海量的的基因数据据集在识别别遗传变异异对疾病的的意义中有有着关键的的作用。在在这个研究究中,当样样本数量是是 3,5500 时时,和精神神分裂症有有关的遗传传变异无法法检测出来来;当使用用 10,000 个样本时时,也只能能有细微的的识别;但但是当样本本达到 335,0000 时,统统计

30、学上的的意义便突突然显示出出来。正如如一个研究究人员所观观察到的一一样,“当达到某某个拐点时时,一切都都变了。”对于更多多数据的获获取,尤其其是像基因因数据等私私人敏感的的数据,对对于研究者者来说将会会是一个巨巨大的挑战战,这一情情况是由以以限制其访访问的隐私私法为主的的各种因素素造成的。大数据之下下的数据集集群与数据据的关系可可能会出乎乎人的预料料,但同时时也很深刻刻。同时,即即使有海量量的数据,大大数据分析析的结果也也不一定完完美。图像像识别并不不能识别这这个图像是是否重要。相关性仍仍然不等于于因果性。利用大数数据技术找找到的相关关性,或许许不能为对对结果、行行为的预测测以及其他他个人判断

31、断提供恰当当的基础。与一般数数据一样,在在大数据中中,解释始始终是重要要的。完美个性化化的福利和和后果融合大量不不同类型的的数据并实实时处理他他们,就有有可能在消消费者开口口之前,就就提供给他他们正确的的信息、产产品或者服服务。少量量数据能够够被结合在在一起,从从而创造出出某个人的的清晰的行行为图谱,进进而预测他他们的偏好好与行为。这些详细细的私人档档案和个性性化的经历历在消费者者市场上很很有用,它它能够向确确定的一类类人推送产产品与服务务,他们中中的一员可可能是一位位酷爱编织织的专业会会计,也可可能是一位位喜欢恐怖怖电影的家家庭主厨。不幸的是,“完美的个性化” (“perfect perso

32、nalization”)也会在定价、服务与机会方面造成微妙的或是不明显的歧视。例如,一项研究表明,涉及到黑人常用名 (例如,“杰梅因(Jermaine)”)的网络搜索比涉及到白人常用名(例如,“杰弗里(Geoffrey)”)的搜索结果中更容易出现含有“逮捕”意味的广告。这项研究无法确定为什么种族偏见的结果会产生,因为在算法上,广告显示的生成是一个基于多变量的综合决策过程。显然,不同的群体通过不同的信息服务所产生的结果,有可能对个人造成真实的伤害,这种伤害可能发生在他们求职、买房甚至只是简单的搜索信息的时候。还有一处值值得关注:大数据技技术能够从从意识形态态或文化上上把人隔离离开来,就就像泡沫过

33、过滤器一样样,有效地地防止他们们接触到一一些对他们们的偏见与与假设构成成挑战的信信息。一些些公司正在在搜集并处处理大量急急剧增长的的数据,并并煞费苦心心地挖掘个个人资料与与他们的喜喜好。然而而,公众对对这些活动动的范围与与规模的认认知是有限限的,消费费者是很少少有机会来来控制这些些被搜集并并且反复使使用的数据据文件。模糊与再识识别数据整合等等技术在使使大数据分分析功能日日益强大的的同时, 也为对目目前个人隐隐私的保护护带来了严严峻挑战。当数据开开始连接到到个人或设设备时,一一些隐私保保护技术将将设法去除除这种链接接,或者将将个人身份份信息“模糊化”(“de-iidenttify”)但是一一些同

34、样有有效的技术术也可以把把这些碎片片化的链接接复原,并并重新确定定相应的个个人或设备备信息。同同样,整合合不同的数数据可能会会导致一些些分析师所所说的“马赛克效效应”(“mosaaic eeffecct”),即个个人身份信信息甚至可可以从不包包括其个人人识别码的的数据库中中得到或者者推断出,只只要明确包包括其爱好好等倾向在在内的行为为图谱即可可。许多技术人人员认为, 数据的模模糊化处理理作为保护护个人隐私私的一种手手段, 其其作用也只只是有限的的。19事事实上,对对数据进行行收集与模模糊化处理理是基于相相关公司不不恢复数据据的承诺与与对应的安安保措施的的基础上的的。对数据据进行加密密、删除独独

35、特标识符符、打乱数数据使其无无法识别个个人,或者者在其个人人资料的控控制上给予予使用者更更多的权限限是目前采采用的几种种技术解决决方案。但但是有目的的的模糊化化处理可能能使数据丧丧失其实用用性与确保保其出处及及相应责任任的能力。此外,它它很难预测测再识别技技术将如何何演变以应应对看似匿匿名的数据据。这将导导致大量的的不确定性性,个人该该怎样控制制他或她的的数据?他他或她该怎怎样反对建建立在海量量数据之上上的决策?数据的保持持在过去,对对于个人信信息的自然然控制的保保存技术经经常可以保保证足够的的隐私。数数据可以被被摧毁,对对话可以被被遗忘,记记录可以被被消除。但但在数字世世界,信息息可以被获获

36、取、拷贝贝、分享、精确的翻翻译并且无无限期的保保存。从前前存储大量量数据的成成本巨大,现现在这些数数据可以储储存在一粒粒米大小的的芯片里,既既简单又实实惠。结果果是数据一一旦被创造造出来,就就可以在许许多情况下下永恒的有有效。此外外,电子数数据经常涉涉及到复杂杂多样的人人群,使得得个人的控控制难以实实现。比如如,谁是一一张照片的的拥有者?是照片的的拍摄者,还还是照片里里表现的人人,是第一一个邮寄它它的人,抑抑或是邮寄寄它的地址址?这些新新科技的发发展基本改改变了一个个人和与他他/她相关关的数据的的关系。数据自由的的分享和复复制的确比比任何时候候都要更多多。个人、政府、企企业、人际际网络、同同事

37、、上台台控制私人人数据的其其他政党,他他们间的特特殊责任仍仍在彼此区区分。然而而,技术发发展的目标标是明确的的:越来越越多的私人人数据会产产生,并在在他人的控控制下保存存。保证数数据的安全全是当务之之急。出于于这个原因因,“公众-个个人合作社社的各种模模型”(“modeels ffor ppubliicpriivatee coooperaationn”),例如如在 20014 年年 2 月月成立的行行政网络安安全结构(Admiinisttratiions Cyyberssecurrity Frammeworrk),是是确保该基基础设施的的安全与可可调整性的的重要部分分,而正是是这套基础础设施,

38、正正在为世界界上许许多多多的数据据库提供服服务。证明我们的的价值无论大数据据所带来的的问题是多多么的严重重与重要,政政府依然会会支持相关关电子经济济的发展并并提供免费费的数据流流来激发大大数据的创创造力。科科技的进步步总是会产产生如何权权衡我们的的隐私与社社会价值之之间的关系系的问题。美国在公公共领域内内,在国会会上,在法法庭里,均均遭受过这这个的问题题所引发的的争议的挑挑战。而在在历史长河河之中,无无论科技如如何变化,我我们一直坚坚定地保护护宪法赋予予公民的权权力。奥巴马总统统上任伊始始,政府就就号召公众众与私营部部门善加利利用数据的的力量,使使其提高生生产力,改改善生活质质量,服务务大众社

39、会会。这也就就意味着,这这项研究并并不仅仅涉涉及大数据据科技的可可行性,还还包括了大大数据是如如何可能挑挑战一般美美国人的价价值观与美美国当下的的法律框架架。这份报报告集中叙叙述了联邦邦政府如何何在大数据据科技改变变消费者与与公民的世世界观的同同时,确保保我们价值值观的延续续与法律的的与时俱进进。去年,关于于隐私方面面的公共争争议主要集集中于政府府,尤其是是在情报机机构如何收收集、储存存,并应用用数据这一一方面。 这份报告告在很大程程度上搁置置了由信号号情报领域域的大数据据使用而引引发的问题题, 对这这一问题的的详细处理理可以参加加总统在 1 月份份发布的政政策指南。相应地,这这份调查报报告也

40、同样样考虑到了了政府通过过收集与使使用这些大大型数据库库给公众带带来了便利利。公众的的信任要求求政府合理理地运行与与工作,并并要求较之之个人, 政府必须须以一个更更严格的标标准来收集集与使用个个人信息。正如奥巴巴马总统所所明确指出出的,“对于一个个领导者而而言,仅仅仅说相信我们们,我们不不会滥用我我们所收集集到的数据据是不够的的。”这份调查报报告开阔了了我们对于于大数据问问题的视野野, 它将将大数据的的应用范围围远远扩大大到情报领领域之外。这种新的的技术不仅仅仅只是在在考察个人人隐私,无无论这种隐隐私是被定定义成不被被干涉,或或者是掌握握某人身份份等其他权权利。在这这份调查报报告中,一一些影响

41、最最为深远的的挑战主要要集中在以以下方面:大数据的的分析有可可能导致新新型的不公公平待遇,尤尤其是对于于弱势群体体; 也可可能产生不不透明的决决策制定环环境,以至至于个人自自治完全迷迷失于在一一堆无法理理解的算法法之中。这些都不是是不能解决决的问题,但但是它们都都需要更加加深入与严严肃的思考考。 谨记记历史学家家梅尔文克兰兹伯伯格(Meelvinn Kraanzbeerg)的的科技第一一定律是非非常重要的的:“技术既无无好坏,亦亦非中立。” 22科科技可以被被用来服务务群众,但但也可以伤伤害个人。不管科技技多么先进进,美国公公众都保留留着一种力力量, 即即他们能够够通过制定定政策与法法律来管理

42、理新技术的的使用, 进而在某某种程度上上保护基本本的价值观观。大数据正在在改变世界界。但是它它并没有改改变美国人人对于保护护个人隐私私、确保公公平或是防防止歧视的的坚定信仰仰。这份调调查报告旨旨在鼓励使使用数据以以推动社会会进步,特特别是在市市场与现有有的机构并并未以其他他方式来支支持这样的的进步的领领域,与此此同时,我我们也需要要相应的框框架、结构构与研究,来来帮助保护护我们的核核心价值观观念。奥巴马政府府在数据开开放与隐私私保护问题题上的发展展路径回顾美国历历史,技术术与隐私法法都处于不不断交替发发展之中。在营造创创新环境、促进经济济繁荣的同同时,美国国一直在全全球范围内内扮演着保保护个人

43、隐隐私的领导导角色。宪法第四修修正案保护护了“人民的人人身、住宅宅、文件和和财产不受受无理搜查查和扣押的的权利”。对实在在空间与有有形资产的的保护体现现了尊重、重视人身身安全与个个人尊严的的意识,公公民良好的的社会行为为与民主社社会的正常常运行依赖赖于此二者者。在美国,一一个保护隐隐私利益的的法律框架架已经建立立起来, 并覆盖了了宪法、联联邦、各州州等各个层层面。“隐私权”不是一个个狭隘的概概念,而是是由一系列列概念组成成的,它们们针对侵害害公民隐私私权的各种种行为,形形成了各个个样式的有有针对性的的保护措施施。在美国国,数据收收集与将数数据造福大大众有着同同样长的历历史。宪法法第二章第第一款

44、授权权进行十年年一度的人人口普查,以以分配美国国众议院议议席。在实实践中,人人口普查从从来没有仅仅仅只进行行简单的人人数计算,而而是收集一一些更为具具体的以公公共利益为为目的的人人口统计信信息。自从奥巴马马总统执政政以来,联联邦政府采采取了史无无前例的政政策措施,将将更多的它它所拥有的的数据向公公众、公司司与创新者者开放。从从 20009 年开开始,奥巴巴马政府将将大量资料料库向公众众开放,并并且将许多多数据公布布在美国政政府的中央央信息交换换库Datta.goov 网站站上。这种种将政府的的信息数据据当作一种种资产并加加以披露,使使其易于获获取与使用用的做法,换换句话说,就就是信息的的公开化

45、。这大大加加强了社会会民主程度度、开拓了了经济发展展机会、改改善了公众众生活质量量。奥巴马政府府关于公开开数据的举举措公开数据计计划根据政府的的公开数据据,我们凭凭借口袋里里的智能手手机就能知知道我们所所处的位置置。几十年年前,联邦邦政府将气气象数据与与全球定位位系统免费费对外开放放,企业家家们得以发发明大量的的新工具,提提供新型服服务,天气气预报 AAPP、汽汽车导航系系统等新发发明因而不不断涌现。在过去,政政府收集数数据的方式式主要是由由政府机构构自己进行行收集,而而奥巴马政政府的一系系列公开数数据的倡议议与决策,使使得过去在在健康、能能源、气候候、教育、经济、公公共安全与与全球发展展等领

46、域内内难以收集集的数据变变得易于收收集,开启启了一个新新的富有价价值的数据据宝库。奥奥巴马在 20133 年 55 月 99 日签署署的第 1136422 号总统统行政令为为联邦数据据管理工作作提出了新新的准则:在保护好好隐私安全全性与机密密性的同时时,将数据据公开化以以及可读写写化纳入政政府的义务务范围。扩扩大公开数数据的影响响也同样是是总统第二二期管理工工作规划的的核心部分分,例如管管理和预算算办公室(Offiice oof Maanageementt andd Buddget, OMBB)就已经经建议其下下属机构公公开更多他他们决策所所依据的政政府信息,因因此,相信信信息公开开将可以惠惠

47、及更多的的人。公众在 DD 网站上可可以找到有有关联邦消消费者金融融保护局(Conssumerr Finnanciial PProteectioon Buureauu, CFFPB)受受到的所有有抗议的信信息,这些些抗议主要要针对于阿阿肯色州学学生贷款的的 9111 个服务务领域。这这表明每个个人可以利利用 Daata.ggov 网网站获得他他们所需要要的公开信信息,而不不需要对政政府机构和和这些机构构所推动的的工作项目目有特别多多的了解。感兴趣的的软件开发发者运用一一些简单的的工具,就就能够自动动获得这些些数据包的的信息。联邦机构在在某种程度度上应根据据公众的要要求优先公公布它们的的数据以扩

48、扩大数据的的影响面,每每一个机构构都被要求求需通过诸诸如邮件系系统或是在在线平台等等数据反馈馈机制来征征求它们应应当收集哪哪些数据。这样一来来,任何倡倡议者、企企业家、研研究者就能能第一时间间联系联邦邦政府,建建议哪些数数据应该被被公开。为为了更进一一步的形成成反馈并促促进政府公公开信息的的有效使用用,政府官官员一直在在积极召开开并参与编编码马拉松松(codde-a-thonns)、头头脑风暴工工作坊(DData Jamss)、数据据开放运动动(Dattapalloozaas)与其其他的一些些以数据开开放为主题题的会议。根据 20013 年年 5 月月的总统行行政令,管管理与预算算办公室以以及

49、科技政政策办公室室(Offfice of SSciennce aand TTechnnologgy Poolicyy, OSSTP)发发布了一个个工作框架架方案,为为各机构管管理运用即即时更新的的信息资源源这一新形形式财产提提供指导,包包括了对保保护个人隐隐私、信息息可信度的的一系列要要求30。政府机构构根据开放放程度已将将信息资产产划分为三三个种类:开放性、半开放性性、非开放放性,并且且只能出版版发行开放放性密级的的信息。为为了增进透透明度,一一些机构需需将一些还还没公布到到网上的技技术性公开开数据纳入入他们的外外部数据财财产清单。“我的大数数据”计划使政府信息息更公开透透明、更易易被机器读

50、读写仅仅是是政府信息息政策的一一个组成部部分。19974 年年颁布的隐私权法法案授予予了公民可可接触一些些与其有关关的个人信信息的权利利,公民行行使这一权权利应该变变得更加安安全高效,从从 20110 年开开始,奥巴巴马政府着着手采取了了一系列主主题为“我的大数数据”的倡议与与措施,使使得美国人人可以更安安全地获取取他们的个个人数据,用用来更好地地处理他们们私人领域域的申请活活动和服务务。“我的大数数据”计划具体体包括以下下部分:“蓝纽扣”计划: “蓝纽扣”允许消费费者安全地地获取他们们的健康信信息,使得得他们可以以更好地管管理他们的的健康与经经济状况,并并与信息提提供者交换换相关信息息。在

51、22010 年,美国国退伍军人人事务部(U.S. Deppartmment of VVeterrans Affaairs, DVAA)开始了了“蓝纽扣”计划,退退伍老兵可可以通过该该计划下载载他们的健健康记录。从那时起起,5400 万退伍伍军人利用用“蓝纽扣”获取他们们的健康信信息,超过过五百家私私人公司允允诺向“蓝纽扣”计划的参参与者提供供更多他们们所掌握的的健康数据据,今天,超超过 1.5 亿的的美国人能能够从健康康服务提供供商、医药药实验室、零售药房房供应商与与州免疫信信息数据库库获得他们们所需的个个人健康数数据。“创建副本本”计划:在在 20114 年,美美国国税局局通过一个个名为“G

52、et trannscriipt”的工具将将纳税人的的信息数据据加以共享享,纳税人人可以通过过它获得他他们自己最最近三年的的纳税记录录。个人纳纳税者可以以借此下载载过去的纳纳税申报单单,这使得得居民进行行抵押、学学生贷款、商务贷款款等活动与与填写纳税税表更加便便捷。“绿纽扣”计划:在在 20112 年,美美国政府与与电力行业业合作推出出了“绿纽扣”计划,这这为家庭与与企业提供供了便捷的的途径来获获得他们的的能源使用用信息, 并且有利利于营造良良好的消费费者环境与与电子化模模式。今天天,为 55900 万家庭与与企业提供供服务的 48 家家电力供应应商通过参参与“绿纽扣”计划,帮帮助他们的的消费者

53、节节约资源。凭借自身身掌握的能能源数据,消消费者可以以选择享受受何种私人人服务,以以更好地管管理他们的的能源消耗耗状况来达达到理财的的目的。“我的学生生数据”计划: 教育部将将助学金免免费申请表表与联邦助助学情况的的一些信息息共享,这这些信息囊囊括了借贷贷、补助金金、注册与与超额偿付付等方面的的具体事项项,这使得得学生与资资助人能够够上网下载载所需信息息资源。在在这些计划划中,信息息都是通过过“注重使用用者体验”、“机器可读读写”、“文本信息息平面化”的方式实实现共享的的。除了为人们们提供安全全、高效的的个人信息息,“我的大数数据”计划帮助助建立了一一个有效的的个人数据据获得性模模型,政府府也

54、希望将将其推广到到更多的私私人与公众众领域。获获取个人信信息的能力力在未来将将会变得越越来越重要要,生活的的各个方面面都将会逐逐步卷入到到个人、公公司与公共共组织的信信息交换之之中。大数据计划划: “数据-知知识-行动动”在未来, “大数据”将会成为为这个信息息交换过程程的核心,使使得数据转转化为知识识,并进而而转化为行行动的过程程更加快捷捷。在 22012 年 3 月 299 日,六六个联邦机机构加入到到“大数据研研究和发展展计划”(“Big dataa Ressearcch annd Deeveloopmennt Innitiaativee”)中来,超超过两亿的的科研经费费被用于工工具与技

55、术术开发以推推进对海量量数据进行行获取、组组织与整理理并发现有有效信息的的相关技术术发展。自从“数据据-知识-行动”(“Dataa to Knowwledgge too Acttion”)计划实实施以来,在在 1 亿亿美金的“XDATTA”项目支持持下,美国国国防部先先进项目研研究局(DDefennse AAdvannced Reseearchh Proojectts Aggencyy, DAARPA)创建了一一个关于研研究出版物物与公开化化资源软件件的“开放目录录”,努力发发展能够处处理分析存存在缺陷的的、不完整整的海量数数据的技术术32。国国家卫生研研究院(NNatioonal Instt

56、ituttes oof Heealthh, NIIH)也拿拿出 50000 万万美金支持持开展生物物领域的“数据-知知识-行动动”计划。国国家科学基基金会(NNatioonal Scieence Founndatiion, NSF)赞助的大大数据研究究计划,为为人类基因因组研究节节省了 440%的经经费。能源源部也宣布布向“可扩展数数据的管理理分析及其其可视化协协会” (“Scallablee Datta Maanageementt, Annalyssis, and Visuualizzatioon Innstittute”)提供一一项 25500 万万美元的赞赞助,这家家机构所处处理的气候候

57、数据信息息使得季节节性台风预预报的准确确性提高了了 25%以上。还还有许多针针对大数据据的研究支支持计划,比比如奥巴马马总统 22013 年 4 月发布的的创新神经经技术脑(BRAIIN)计划划。作为政政府大数据据计划的组组成部分,国国家科学基基金会为大大数据中出出现的社会会、道德与与公共政策策问题的相相关研究也也提供了特特别的资金金支持。美国隐私法法案和国际际隐私法框框架美国隐私私法的发发展工业革命带带来的技术术革新浪潮潮使得社会会发生巨大大变迁,隐私法正是在这这一社会背背景上发展展起来的。隐私权最最初由美国国学者沃伦伦(Sammuel Warrren) 和布兰蒂蒂斯(Loouis Bran

58、ndeiss)在 11890 年由两人人合著的著著名法学论论文隐私私权一文文中提出,初初代可便携携照相机的的出现直接接促成了他他们观点的的提出,在在论文中,他他们指出“最近的发发明与商业业应用将人人们的目光光吸引到个个人隐私权权的保护上上来,这项权利利应不受侵侵犯很多技术术发明威胁胁到了隐私私权,窃窃私语语被公之于于众的预言可可能被实现现。”提出建立立普遍性的的隐私保护护法的倡议议出现在 20 世世纪,这一一倡议富有有预见性,建建立了从政政府到个人人的涵盖各各个方面的的公民隐私私权。案例法历经经了上个世世纪的发展展,其中关关于宪法第第四修正案案的解释条条目随着时时间与技术术的发展也也在不断进进

59、行调整。在 19928 年年,联邦最最高法院受受理了“欧姆斯戴戴徳诉美国国联邦政府府”(Olmmsteaad v. Uniited Stattes)一一案并宣判判在诉讼人人屋外设置置电话窃听听装置并没没有违反宪宪法第四修修正案,即即使政府以以此获得了了屋内谈话话的内容。但是,欧欧姆斯戴德德案的裁定定因为贾斯斯蒂斯布兰蒂斯斯(Jussticee Braandeiis)的抗抗辩而传播播得更广,他他写道:“国父们曾曾经授予公公民其隐私私不可侵犯犯的权利以以限制政府府的行为。”欧姆斯戴德德案的法庭庭决议一直直沿用,直直到 19967 年年 “卡茨诉联联邦政府” (Kaatz vv. Unnitedd

60、Staates)一案才被被推翻。法法庭认为,联联邦调查局局(Fedderall Burreau of IInvesstigaationn, FBBI)在没没有调查授授权的情况况下在公用用电话亭外外安装监听听记录装置置,侵害了了个人使用用公用电话话时应有的的同时也是是符合个人人期待的隐隐私权,即即使这个装装置没有置置于电话亭亭内部,或或是身体以以及财物上上。此后,主主观期待的的隐私权得得到保护,社社会也开始始将这视为为理所当然然。民事法庭并并没有立即即将隐私权权认定为一一个公民向向他者提起起诉讼的正正当理由也就是是律师们常常说的“诉因”(“causse off acttion”)。直到到 193

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论