




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
目录
CONTENTS网络大数据网络舆情舆情指数案例分析研究与反思网络大数据1大数据的概念感知数据人类原创数据运营数据人类社会数据生产方式世界知名的咨询公司麦肯锡最早提出了“大数据”的概念,麦肯锡认为大数据是指无法在一定时间内用传统数据库软件工具对其内容进行采集、存储、管理和分析的数据集合。大数据的概念研究机构Gartner将大数据定义为:需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据的概念维基百科对“大数据”的解读是:“大数据”(Bigdata),或称巨量数据、海量数据、大资料,指的是所涉及的数据量规模巨大到无法通过人工,在合理时间内达到截取、管理、处理、并整理成为人类所能解读的信息。大数据的概念传媒专家刘建明教授认为:“大数据”同信息是不可分离的,是指信息浩大数量的统计与技术运作。作为人类认知社会方法的一次飞跃,“大数据”技术将给企业运营、政府管理和媒体传播的科学化创造有效机制。大数据的概念“大数据”不是部分,而是全部数据是不确定、不准确的信息着重在了解是“什么”而不是“为什么”大数据的概念《大数据时代》维克托·迈尔·舍恩伯格大数据的概念大数据本身不是一种新的产品或新的技术大数据的出现只是数字化时代数据量不断增加的一种现象大数据的概念BZB海量数据大数据大数据的概念大数据的发展进程0302011966年摩尔定律提出,为大数据现象的形成奠定物理基础1989年数据挖掘技术产生,大数据有了大价值2004年社交媒体出现,全世界每个人都变成了潜在数据生成器大数据的特点数据自身的状态与价值随着时空变化而不断发生演变(流动速度快)数据的价值没有随数据量的指数增长呈现出同比例上升(价值巨大但密度低)结构化数据、半结构化数据和非结构化数据(数据类型繁多)大量交互数据被记录和保存,数据规模从到数量级(数据体量巨大)个:、、、大数据的特点1大数据=传统的小数据+现代的大记录2大数据=结构化数据+非结构化数据3大数据=大价值+大容量大数据如何产生10:02微博云计算物联网托马斯··达文波特:大数据之所以产生,是因为传感器和微型计算机处理器在人们日常生活中无处不在。大数据如何产生网络舆情的大数据时代来临12354Google400PBFacebook10亿照片300TB微信百度云每个人1天200G月活8亿5000国图网络大数据网络舆情2舆情的概念舆情指在一定的社会空间内,围绕中介性社会事项的发生、发展和变化,作为舆情主体的民众对国家管理者产生和持有的社会政治态度。广义的舆情,就是指民众的全部生活状况、社会环境和民众的主观意愿,也就是通常所说的“社情民意”。网络舆情的概念网络舆情是社会舆情的一种表现形式,指在一定的网络空间中,各种社会群体对自己关心或与自身利益相关的热点事件或事物所表现出来的具有一定影响力并带有倾向性的认知、情绪、态度和意见的总和。传播互动网民情感互动影响力网络事件01020304主观性与非理性社会情绪的原生态表达网络谣言与负面情绪扩散多元性信息内容多元传播途径与表达方式多元意识形态与观点内容多元突发性基于网络双向传播社会舆论导火索广泛性参与人员类型广泛涉及地域范围广泛网络舆情的特点网络舆情的信息来源政府网站高高低低新闻媒体高高中中社交平台低低高中网络媒体中中中中中来源准确度权威度参与度针对性主动报送中高高网络舆情信息来源指标特点网络舆情传播的特点跨时空性:信息突破了空间的限制,实现了信息的跨时空传播1234强制互动性:信息由单向传播变成双向互动,公众由接受者变为参与者和生产者及时性:即时编辑、及时发布、即时传播、即时互动、及时反馈群体极化性:信息的倾向性对受众的思想形成一定的支配性,形成群体极化网络舆情的演变过程舆情影响萌芽扩散爆发波动消退经历时期表:网络舆情演变模型网络舆情的演变过程舆情影响萌芽扩散爆发波动消退经历时期表:网络舆情预警模型良好正常隐患不安全危险网络舆情的演变过程舆情影响萌芽扩散爆发波动消退经历时期表:政府应对舆情模型良好正常隐患不安全危险启动舆情监测制定应急预案制定保障方案实施信息公开专家网上答疑关注意见领袖网民互动交流事件初步解决公开进展信息引导舆情过渡事件经验总结监测衍生舆情舆情指数3网络舆情指数的概念舆情指数是通过对网络中各种类型媒体所发布的信息进行独立的第三方观察,形成量化统计和定性分析,并结合算法推导、归纳总结而最终形成的一套网络舆情指数体系。网络舆情指数体系构建的基本原则科学性系统性全面性可行性动态性稳定性明确性目标性互联网大数据挖掘技术数据库理论机器学习人工智能现代统计学互联网大数据挖掘技术统计技术:对给定数据集合假设一个分布或者概率模型连接分析:从一些用户的行为中分析出一些模式,
同时将产生的概念应用于更广的用户群体中
决策树:一种预测模型,是直观运用概率分析的一种图解法人工神经网络:是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型差别分析:目的是发现数据中的异常情况,从而获得有用信息概念描述:对某类对象的内涵进行描述,并概括其有关特征关联规则:目的是找出数据库中隐藏的关联网网络舆情监测指数体系(兰月新)指数一指数三指数四指数二传播扩散舆情受众发布主体内容要素指数体系1234名称一级指数二级指数三级指数网络舆情监测指数体系持续时间地理范围传播方式主体身份影响力活跃度意见倾向主题内容主题词热度主题敏感度视听化程度内容详略度态度倾向关注人数传播扩散时间跨度地理跨度网站、网媒、社交媒体意见领袖、普通网民发帖量、回复量支持、反对、中立社会热点、政治新闻、个人隐私、宗教政治转发量、评论量、阅读量敏感词声像资料量文本长度、图片连贯性、声像时长支持、反对、中立独立访问者、访问量发布主体内容要素舆情受众网络舆情监测指数体系(兰月新)舆情大数据指数(刘建明)舆情大数据指数媒体传播力指数传播量覆盖率互动性舆情影响力指数传播量覆盖率关注度综合评价刘志明《网络舆情大数据》网络舆情指数体系()“网络舆情指数体系()”是由中国传媒大学网络舆情(口碑)研究所设计,该指数体系是国内第一个权威的、可量化的、科学的网络舆情指数体系,重点突出网络舆情指数的实时动态性以及可理解、可描述、可解释等特点。123IRI网络舆情参与度网络舆情波及度网络舆情评价度网民在某网站中针对某一主题发布的信息量、回复量和浏览量的综合统计——集中参与水平衡量所有网络媒体中相关信息的指标——广泛报道水平整体态度倾向的指标百度司南舆情系统指数声量诊断传播分析情感提炼某话题/人物/商品/事件在互联网上是否引起了关注度,关注量级与趋势如何舆情传播路径,识别传播节点,研判节点调性摩画网民情感倾向,提炼网民对事物的主要态度、关注面与侧重点人群分析舆情受众画像,偏好人群&厌恶人群特点清博指数以大数据为核心技术支撑,全方位整合传统门户、微博、微信、论坛、外媒等舆情信息矩阵,高效稳定的数据采集平台,深度分析挖掘网络舆情,预测消费者的商业兴趣与社交行为,为企业品牌评估、战略部署提供有力数据支撑。BCIBVIOCIWII-VRTGI标题内容清博指数微信传播指数清博指数微博传播指数指标体系:
主要通过活跃度和传播度两大维度来进行评价,发博数、原创微博数、转发数、评论数、原创微博转发数、原创微博评论数、点赞数。
清博指数微博传播指数清博指数网红指数网红指数侧重于对网红传播力和影响力的量化评估,评估模型包括三大维度、十余项项量化指标,通过全网数据的采集,建立基于大数据的开放评估模型。清博指数指数评估指数包括企业和产品的网络关注度(微博讨论及官微粉丝数、微信相关文章及总阅读数等),全网推广度(网页、新闻、官网、社交媒体平台等相关信息推广)和网络热销度(主流电商平台:以淘宝天猫和京东为主)三大维度。
()全景数据评估指数全景数据评估指数算法说明:使用文章数量、可见总流量、认同流量、可见峰值流量四个主要指标,并提出认同潜力值、可见峰值流量比率两个指标。本算法由上海交通大学大数据传播创新实验室综合多类资源提出,使用运筹学中的层次分析法()进行系数的确定,得到,,,λ。案例分析4百度舆情研究院《大数据中的“春运潮”变迁》“百度迁徙”发布春运全国小时最热线路图春运迁徙,天,亿人次春运槽点:“”“高价盒饭”“车站服务”“安检”“堵车”“晚点、滞留”案例一:百度舆情研究院《大数据中的“春运潮”变迁》关注度=×新闻指数+×论坛指数+×微博指数+×微信指数正面舆情比例=×正面舆情指数+×中性舆情指数舆情压力指数×舆情事件个数×舆情关注度均值正面舆情事件比例百度舆情研究院《大数据中的“春运潮”变迁》关注度=×新闻指数+×论坛指数+×微博指数+×微信指数百度舆情研究院《大数据中的“春运潮”变迁》百度舆情研究院《大数据中的“春运潮”变迁》正面舆情比例=×正面舆情指数+×中性舆情指数舆情压力指数×舆情事件个数×舆情关注度均值正面舆情事件比例百度舆情研究院《大数据中的“春运潮”变迁》正面舆情比例=×正面舆情指数+×中性舆情指数舆情压力指数×舆情事件个数×舆情关注度均值正面舆情事件比例研究与反思5大数据视域下舆情研究的转向研究视角的转向研究方法的转向
数据库支持的转向舆情研究主体的转向从单向度的内容研究转向“内容+关系”的多维度研究由舆情信息采集转向数据加工、可视化等由简单的、有限的数据库转向非结构化的大数据库由小作坊式的单打独斗、面面俱到舆情监控转向分工明确、高度聚合集约的舆情分析舆情研究重点的转向由舆情监测转向为舆情预警乃至预测,从单向度的危机应对、品牌营销转向各领域的综合信息服务大数据舆情能否代表社会民意根据中国互联网络信息中心《第次中国互联网络发展状况统计报告》显示,截至年月,中国网民已达到亿,超过总人口的。农村网民占总网民的,达亿,而中国农村人口将近亿,网民占比较低。即使上网,发表意见的也是少数。陈力丹在《舆论学》指出:「在一定范围内有接近的人持某种意见,这种意见由于开始对全部人产生影响,故它已经从少数人的意见转变为舆论。」「在一定范围内有接近的人持某种意见,这种意见已经可以统领全局,当然更是舆论,而且成为主导舆论。」「要注意,不能轻易把网上的意见视为舆论。网民占全国人,网民在网上发表意见的人数,只占所有网民的,经常发表意见的人数更少。」因此,网民大都属于「沉默的大多数」,通过技术手段抓取关键词呈现出的意见状况会出现代表性偏差,与符合真实情况可能出现不一致。大数据舆情能否代表社会民意信息源头的污染网民享有了表达意见的自由,但网络信息却并非态度、意见和情绪的直接和客观的反映。网络的虚拟性使得网络言论往往出现情绪化和极端化的现象。其次是大量网络「水军」的存在,会影响到对事实情况的判断。大数据舆情能否代表社会民意爱德华·霍尔创建了「高语境」和「低语境」的概念。高语境是指对语境依赖程度较高的语言,如中文和日文。在中文传播环境中,语言信息呈现在语境之中,高度依附语境。使用爬虫等技术手段抓取的网络信息是有噪声的,在进行回归分析与差异分析时,不能彻底摆脱高语境依赖,由此得出的分析结果并不能完整的解释其实际意义,进而也会干扰舆情判断。大数据舆情能否代表社会民意「大数据」是原材料,「算法
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- JJF 2199-2025数字式时钟校准规范
- 前期策划合同范本
- 养牛设备出售合同范本
- 保障性住房购房合同范本
- 加油卡租车合同范本
- 协议单位优惠合同范例
- 医药物流合同范本
- 修叉车合同范本
- 劳务分包协议合同范本
- 劳务合同范本已填
- 脱硫自动化控制-洞察分析
- 医务人员医德医风培训
- 人教版初中历史八上-第2课 第二次鸦片战争
- 2024湖北省金口电排站管理处招聘易考易错模拟试题(共500题)试卷后附参考答案
- 油井供水合同范例
- 2025年人教部编版语文五年级下册教学计划(含进度表)
- 全国计算机等级考试一级试题及答案(5套)
- 银河证券-科创板认知测评题目及答案
- 产品方案设计模板
- 部队通讯员培训
- 物业公司水浸、水管爆裂事故应急处置预案
评论
0/150
提交评论