《新媒体数据分析与应用》新媒体数据的收集_第1页
《新媒体数据分析与应用》新媒体数据的收集_第2页
《新媒体数据分析与应用》新媒体数据的收集_第3页
《新媒体数据分析与应用》新媒体数据的收集_第4页
《新媒体数据分析与应用》新媒体数据的收集_第5页
已阅读5页,还剩31页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

数据是开展数据分析的前提,新媒体运营者只有收集到足够多的有价值的数据才能进一步建立数据分析模型,再通过分析数据发现数据背后隐藏的规律,从而得出有价值的分析结果来指导新媒体的运营。本章将详细介绍收集新媒体数据的流程与方式,以及如何使用网络爬虫工具采集数据。新媒体数据的收集初识新媒体数据收集2.1目录CONTENTS使用网络爬虫工具采集数据2.2初识新媒体数据收集2.1数据收集,即根据数据分析的需要收集相关的数据,它是新媒体运营者开展数据分析的一个必要环节,也是做好数据分析的基本保障工作。2.1.1新媒体数据收集的基本流程1明确信息需求(1)明确核心指标(2)根据核心指标构建数据分析指标体系(3)根据数据分析指标体系有针对性地采集数据2按需求采集数据(1)运营者要整理出数据指标(2)根据数据指标和数据分析目的采集数据2.1.2新媒体数据可用性的判断数据来源数据细节数据真实性

的判断检查数据记录和字段是否完整数据完整性的判断数据的时效性数据的支持性数据的全面性数据价值性的判断2.1.3新媒体数据收集的方式从新媒体账号后台获取数据某公众号“昨日关键指标”分析2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据微热点(微舆情)热点分析2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据微热点(微舆情)“大数据报告”板块发布的热点解读报告2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据微热点(微舆情)分析工具2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据百度指数关键词“直播带货”的搜索指数趋势2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据新榜新视指数榜单中“美妆”类视频号的日榜2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据新榜新抖抖音号搜索的相关数据2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据新榜新快新快直播电商下的“销售额排行”页面2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据新榜新站新站UP主搜索页面2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据飞瓜数据飞瓜数据抖音版工作台2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据卡思数据卡思数据“数据报告”板块2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据卡思数据卡思数据哔哩哔哩平台版的“达人查找”页面2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据卡思数据达人详情页2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据蝉妈妈抖音商品销量榜2.1.3新媒体数据收集的方式使用第三方数据分析工具收集数据蝉妈妈商品详情分析页2.1.3新媒体数据收集的方式使用网络爬虫工具采集数据八爪鱼采集器八爪鱼采集器首页2.1.3新媒体数据收集的方式使用网络爬虫工具采集数据爬山虎采集器爬山虎采集器的主界面工具栏任务列表起始页使用网络爬虫工具

采集数据2.2对于新媒体运营者来说,使用网络爬虫工具采集数据既简单又便捷。下面以八爪鱼采集器为例,介绍使用网络爬虫工具采集数据的方法。八爪鱼采集器提供了模板采集、自定义采集、云采集等多种采集模式,新媒体运营者可以根据自己的需求选择合适的采集模式来采集数据。2.2.1模板采集模板采集就是使用由八爪鱼采集器提供的采集模板进行数据采集。目前,八爪鱼提供的采集模板超过200个,涵盖各主流网站的采集场景。模板采集模式简单易操作,新媒体运营者在采集数据时只需输入网址、关键词、页数等参数,就能快速获得目标网站的数据。使用八爪鱼采集器中的模板采集模式采集数据的操作步骤如下。2.2.2自定义采集新媒体运营者使用智能识别模式采集数据时,只需输入要采集数据的目标网址即可,八爪鱼采集器能够自动智能识别网页数据。使用八爪鱼采集器智能识别模式采集数据的操作步骤如下。使用智能识别模式采集数据2.2.2自定义采集采集流程(也叫采集任务、采集规则)是指从特定网页上提取数据的一系列步骤。自己手动配置采集流程,可以灵活应对各类采集场景,包括翻页、滚动、登录等。由于每个网站的页面布局是不同的,因此采集流程不能通用。通常来说,一个网站需要配置一个采集流程。自己手动配置采集流程采集数据采集流程2.2.2自定义采集自己手动配置采集流程采集数据单个数据的采集以在京东商城商品详情页上采集商品数据为例,使用八爪鱼采集器手动配置采集流程进行单个数据采集的操作步骤如下。2.2.2自定义采集自己手动配置采集流程采集数据从列表进入详情页采集数据头条号文章列表文章详情页2.2.2自定义采集自己手动配置采集流程采集数据从列表进入详情页采集数据下面以采集头条号文章的数据信息为例,介绍如何使用八爪鱼采集器自定义采集模式从列表进入详情页采集数据,操作步骤如下。2.2.2自定义采集自己手动配置采集流程采集数据多页数据的采集单击“下一页”按钮实现翻页2.2.2自定义采集自己手动配置采集流程采集数据多页数据的采集下面以在哔哩哔哩平台上按类目标签采集视频数据为例,介绍使用八爪鱼采集器采集通过单击“下一页”按钮实现翻页的网站的数据的方法,操作步骤如下。2.2.3云采集云采集是指使用由八爪鱼采集器提供的云服务集群进行数据采集。在云采集模式下,新媒体运营者可以实现7×24小时不间断采集数据。新媒体运营者可以在本地计算机上完成采集流程的配置,测试采集流程没有问题以后,便可启动云采集,由八爪鱼采集器的云服务集群采集数据。2.2.3云采集启动云采集单击“启动云采集”按钮2

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论