版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
第七章新媒体的数据化应用:数据驱动下的内容生产新媒体导论(第二版)网络与新媒体专业系列教材第一节新媒体时代数据应用的发展及对内容产业的影响一、数据应用技术的不断升级二、数据应用技术发展对内容产业的影响目录第二节用户的数据化分析一、用户画像描绘二、用户位置测量第三节数据新闻生产与信息图表制作一、数据新闻、信息可视化、信息图表二、数据新闻的生产要点三、如何进行新闻可视化四、信息图表的制作要点第四节数据风险与数据素养一、数据假象:数据应用中的重要风险二、数据时代个体权利让渡风险三、数据素养的内涵及目标定义:通俗地说,今天的算法可以看作是用计算机程序实现的、基于数据分析、面向特定目标的一套指令或方案。算法以数据为基础,也是数据应用的一个重要方向。算法应用普及的更大背景是人工智能的发展。大数据技术(图源网络)第一节
新媒体时代数据应用的发展及对内容产业的影响一、数据应用技术的不断升级大数据技术算法定义:一般认为,大数据是基于相当大量级的数据进行数据收集、分析、挖掘与应用的技术。大数据是各种技术的综合产物,也会因各种技术的发展而不断演进。来源:互联网是最主要的数据来源之一。特点:四个“V”,即多样性(Variety)、体量(Volume)、速度(Velocity)和价值(Value)/真实性(Veracity)“大数据”时代意味着数据的处理、分享、挖掘、分析等能力将得到前所未有的提升。第一节
新媒体时代数据应用的发展及对内容产业的影响二、数据应用技术发展对内容产业的影响数据应用新技术提升用户分析水平数据应用催生新产品、新服务、新营利模式数据应用驱动新闻业务变化数据应用介入内容生产决策数据应用改变广告模式数据应用改变内容产业链条数据技术的应用(图源网络)个体用户的数据化画像主要依赖以下几类数据:其一是用户在各种平台提供的相关个人信息。其二是用户在社交平台公开分享的内容。其三是用户在各种平台的行为数据。群体用户的数据化画像涉及:人口统计方面的特征成员的共同兴趣行为特征文化属性关系纽带群体关系模式......整体用户的数据化画像主要包括以下几方面:用户的构成结构用户在网络中的分布模式用户使用产品的共性化场景用户对产品的使用习惯或模式分析一、用户画像描绘第二节用户的数据化分析用户的物理位置测量测量:主要可以通过移动终端的定位系统来完成。核心问题:如何理解地理位置与内容、社交、服务之间的关联,如何实现内容、社交、服务与特定空间需求的匹配,这才是需要解决的核心问题。用户的社会位置测量社会位置:指的是用户在其社会关系中的位置及这一位置中蕴含的资源。测量:社会网络分析方法已经提供了一些思路与方法,但要更广泛而精确地对每个用户进行社会位置的测量,还依赖未来的新方法与新技术。用户的服务位置的测量服务位置用户的“需求方位”用户能够提供的“资源方位”测量:需要通过用户行为数据、用户主动生产的内容以及可穿戴设备、传感器等几者共同完成。二、用户位置测量第二节用户的数据化分析(一)数据新闻第三节数据新闻生产与信息图表制作一、数据新闻、信息可视化、信息图表定义数据新闻,也可以称为数据驱动的新闻。本书定义:通过数据的采集和加工来发现新闻、呈现新闻要素、解释新闻的手段和形式。作为一种驱动和叙事手段,数据的优势在于:其一,它可以刻画事物的某些特征,也可以展现一个事物的动态变化过程,它也便于进行相关事物的对比。其二,它可以帮助人们更好地了解事物的整体面貌或深层表现。其三,它可以帮助人们理解事物之间的内在联系。其四,数据可以揭示某些事件发生的原因,或提供相关证据。其五,借助数据,我们有可能触及某些现象或事物的内在模式或规律。其六,在预测某些事物的趋势与走向方面,数据具有独特的力量。(二)信息可视化与数据可视化第三节数据新闻生产与信息图表制作一、数据新闻、信息可视化、信息图表信息可视化指的是用图形、图像、视频等视觉符号方式来进行数据、知识、新闻或其他抽象信息的传达。一般信息图表中的形象化呈现,并不一定都要以数据的分析与加工为前提。数据可视化(DataVisualization):信息可视化中的一种。数据可视化需要具备两个要素,一是可以被用于分析的数据,二是其形象化的呈现。数据可视化既强调“可视化”,更强调这种可视化的基础是“数据”。信息图表(informationgraphic,简写为infographic),是信息可视化的结果。信息图表指将数据、知识、信息等形象化、可视化的手段。信息图表可以是静态的图片,也可以具有互动效果。信息图表与融合报道的关联:信息图表可以是融合报道的一个构成部分,也可以成为一个融合性报道的完整载体。(三)信息图表(一)数据新闻生产的一般流程第三节数据新闻生产与信息图表制作二、数据新闻的生产要点数据新闻与其他类型的新闻生产,有些地方类似,但也有其独特之处。数据新闻也需要进行选题策划。判断新闻选题的价值判断选题能否找到适合的数据以及适合用数据表现的角度在确定选题的基础上,需要寻找与获得与主题相关的可靠数据,并对数据进行有效清洗、加工,最后找到最有表现力的形式。数据新闻的倒金字塔结构(保罗·布拉德肖)数据的收集(Compile)数据清洗(Clean)了解数据的背景(Context)数据的结合(Combine)(二)如何用数据来讲新闻第三节数据新闻生产与信息图表制作二、数据新闻的生产要点1.用数据描绘新闻对象的主要状态2.用数据强调新闻的某个典型侧面或主要特征3.通过数据揭示内在冲突或戏剧性4.用数据呈现事物异常或变动5.在数据分析中梳理内在规律与模式6.用数据刻画事物之间的关系、关联7.在数据分析中探究原因或背景8.基于数据预测变化趋势(三)数据新闻的数据来源于哪里第三节数据新闻生产与信息图表制作二、数据新闻的生产要点1.来源于新闻或媒体2.来源于政府机构、组织或企业3.来源于专业类网站(客户端)或数据库5.来源于物联网6.众包化数据采集7.其他数据来源4.来源于用户(四)如何采集所需数据第三节数据新闻生产与信息图表制作二、数据新闻的生产要点1.需要编程的工具(如python)2.傻瓜式工具(如WebScraper、八爪鱼采集器)3.软件中内置的工具(如Excel中的“自网站”操作)八爪鱼采集器(图源网络)(五)如何让数据变得更“干净”第三节数据新闻生产与信息图表制作二、数据新闻的生产要点1.数据可用性判断可用性的鉴别目标主要包括:其一,判断数据的真实性、权威性等。其二,了解与分析数据产生的背景。其三,分析数据质量。其四,判断数据在特定主题下的价值。一是数据对特定主题或观点的支持能力。二是在此主题下数据的完备性。2.数据的“清洗”具体工作主要包括:(1)去除数据中的杂质(“脏数据”)不完整的数据、重复的数据、错误的数据、相互冲突的数据(2)规整数据格式数据清洗需要借助一些工具。较为简单好用的数据清洗工具包括OpenRefine、Excel等。(六)如何避免数据分析中的误区第三节数据新闻生产与信息图表制作二、数据新闻的生产要点1.用局部数据代表全局数据2.绝对值滥用3.平均数误用4.概念的错误使用6.将“相关关系”错误地解释为“因果关系”7.虚假的“相关性”8.“辛普森悖论”9.小样本或样本偏差注意数据应用与分析中常见的陷阱:5.“幸存者偏差”误区新闻可视化的主要任务包括以下几方面第三节数据新闻生产与信息图表制作三、如何进行新闻可视化1.提示要点2.揭示关系3.图解过程4.梳理进程6.解释原理7.阐释观点8.揭示规律9.实时交互5.展现情状10.个性化服务(一)信息图表的逻辑结构第三节数据新闻生产与信息图表制作四、信息图表的制作要点1.基于“展示”的逻辑结构2.基于“叙事”或“论证”的逻辑结构3.基于“比较”的逻辑结构4.基于“演变”的逻辑结构5.基于“关联”的逻辑结构ABANDONEDATSEA:THEDESPERATEJOURNEYSOFROHINGYAREFUGEES——ProducedbyKontinentalist&联合国难民署(UNHCR)(二)信息图表的构成要素第三节数据新闻生产与信息图表制作四、信息图表的制作要点1.信息图表的视觉符号(1)基于数据的可视化图形的选择常见的可视化图形:饼图、圆环图、条形图、柱状图、折线图、堆栈图(面积图)散点图、树图、雷达图、地图、网络图(关系图)、词云图(2)与数据无关的图形符号选择更为自由,但总体原则是直观、简洁2.信息图表的标题3.信息图表中的文字4.信息图表中的图例5.信息图表中的注释图标获取网站(三)信息图表中的视觉设计版面布局:一方面需要考虑美观的因素另一方面也需要考虑内在逻辑的因素需要遵循以下几个原则:明晰好看高效有节制的互动(四)信息图表的用户体验第三节数据新闻生产与信息图表制作四、信息图表的制作要点澎湃美数课(五)信息图表的制作工具1.数据可视化工具2.图形、图像处理工具3.交互式效果制作工具1.数据应用与分析中的误区特别注意准确性、合理性需要反复考量自己拥有的数据究竟能说明什么问题在用文字进行数据及其关系进行解释时,也要防止“过度解读”2.表现形式中的误区(1)图形选择失当(2)坐标轴单位或起点失当(六)信息图表制作与传播中的常见误区第三节数据新闻生产与信息图表制作四、信息图表的制作要点3.应用中的误区(1)滥用信息图表(2)传播平台选择失当网易“数读”栏目第四节
数据风险与数据素养一、数据假象:数据应用中的重要风险(一)数据样本偏差带来的“以偏概全”(二)“脏数据”带来的污染(三)数据分析模型偏差带来的方向性错误(四)数据挖掘能力有限带来的“浅尝辄止”(五)数据解读的偏差大数据时代(图源网络)(一)隐私权风险:以隐私换便利属于自己的数据,保存权却不在用户,用户本身也无法限制其使用范围,这是数字时代对隐私权的一个巨大挑战。相关事件:棱镜门事件Facebook数据门事件2018年,李彦宏在中国发展高层论坛上的讲话相关思考:在某些时候,以隐私换便利是用户的一种不得已的选择。用户应该有权利知道出让的是哪些隐私数据,能获取哪些便利,以便他们做出权衡。用户数据使用权限的边界用户是否应该拥有一种隐身能力?在个体被随时随地“数字化”映射的情况下,隐身,也是保护隐私的一个重要方面。二、数据时代个体权利让渡风险第四节
数据风险与数据素养(二)被遗忘权风险:“遗忘”变成例外维克托·迈尔-舍恩伯格《删除:大数据时代的取舍之道》一个不可回避的问题:今天这个时代,遗忘变成例外,记忆成为常态,人类住进了数字化圆形监狱。相关法律:欧盟2012年出台的《一般数据保护条例》(建议稿):被遗忘权概念被官方首次提出我国2013年2月起实施的《信息安全技术公共及商用服务信息系统个人信息保护指南》2017年6月起实行的《中华人民共和国网络安全法》:正式确认了个人对其网上个人信息的“删除权”被遗忘权执行中存在的难题:言论与公私领域:对被遗忘权的讨论,常常会涉及它与言论自由、国家安全的关系。法律层面:如被遗忘权的效力(包括内容效力、范围效力等)、被遗忘权的权利主体范围(这一权力对公共人物、罪犯与恐怖分子是否适用)、被遗忘权的义务主体范围等。技术层面:网络信息复制、扩散的便捷,也意味着“删除”未必是能“一键实现”的。大多数普通人并不知道被遗忘权的存在。二、数据时代个体权利让渡风险第四节
数据风险与数据素养数据素养的内涵所谓数据素养(dataliteracy),是指人们有效且正当地发现、评估和使用信息和数据的一种意识和能力。通常,数据素养概念包含数据意识、数据获取能力、分析和理解数据的能力、运用数据进行决策的能力以及对数据作用的批评和反思精神。——金兼斌数据素养目标数据伦理的教育应逐步纳入公众的
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 专题2 平移变换与等积变形
- 2022-2023学年江西省宜春市宜丰中学高一(下)期中地理试卷
- 幼儿寻求帮助课件
- 西湖课件下载
- 专题三 珍爱生命 直面挫折(学生版)
- 物业客服沟通培训
- 心血管护理知识
- 填图03 认识大洲
- 感谢医疗人员
- 湖北汽车工业学院《通信电子线路》2023-2024学年第一学期期末试卷
- MOOC 实验室安全学-武汉理工大学 中国大学慕课答案
- 学校危险化学品安全教育
- 屋顶绿化养护管理规范
- 2024年中储粮质检中心有限公司招聘笔试参考题库附带答案详解
- 私募基金纠纷案件裁判指引
- 阴道流血症状护理
- 园林植物器官的识别-园林植物生殖器官的识别
- 炼钢厂安全生产教育培训课件
- 拼音四线三格A4打印版
- 机械专业职业生涯发展报告
- 生物技术为精准医疗注入新动力
评论
0/150
提交评论