旅游大数据理论、技术与应用课程方案、案例分析_第1页
旅游大数据理论、技术与应用课程方案、案例分析_第2页
旅游大数据理论、技术与应用课程方案、案例分析_第3页
旅游大数据理论、技术与应用课程方案、案例分析_第4页
旅游大数据理论、技术与应用课程方案、案例分析_第5页
已阅读5页,还剩47页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

《旅游大数据理论、技术与应用》课程方案

第一部分:课程大纲

一、课程基本信息

课程代码

课程中文名称旅游大数据理论、技术与应用

课程英文名称Tourismbigdatatheory,techno1ogyand

课程性质□必修口V选修

□通识必修口通识选修口学科(大类)基础

课程类别

□专业核心口5/专业选修

总学分讲授实验实训实习

学分

3

总学时讲授实验实训实习

课内学时

50

课外学时无

适用专业旅游管理

先修课程经济学、管理学

课程负责人戴斌

《旅游大数据理论、技术与应用》,戴斌、唐晓云主编,

选用教材

高等教育出版社,2022年

二、课程简介

中文课程简介:

本书是反映旅游大数据理论前沿、核心技术和典型应用的旅游管理专业教学

用书。本书在总体框架设计上,从旅游大数据基础知识导入,按照“理论——

技术——应用”的逻辑,聚焦大数据在旅游领域应用的核心技术和主要场景,

兼顾大数据与旅游大数据之间的普遍性和特殊性,主要阐述了旅游大数据基础理

论、采集与预处理、存储与管理、处理与分析、结果可视化的方法与工具,以及

旅游大数据在政府公共服务和管理创新、旅游企业创新等方面的内容,为学生

全面认识旅游大数据并具有旅游大数据应用能力提供指引。本书还对大数据思

维与旅游创新发展、旅游大数据伦理及治理等新问题进行了阐述,重点突出了大

数据在旅游统计和游客画像等方面的基础应用,为面向以数据新要素推进旅游业

现代化体系建设的理论探索和人才培养提供支持。

英文课程简介:

Thisbookisaprofessionalteachingbookfortourismmanagementthatreflectsthe

cutting-edgetheory,coretechnologiesandtypicalapplicationsoftourismbigdata.In

termsoftheoverallframeworkdesign,thisbookstartsfromthebasicknowledgeof

tourismbigdataandfollowsthelogicof“theory-technology-application”,focuseson

thecoretechnologiesandmainscenariosfortheapplicationofbigdatainthetourism

field,takesintoaccounttheuniversalityandparticularitybetweenbigdataandtourism

bigdata,andmainlyexpoundsthebasictheory,collectionandpreprocessing,storage

andmanagement,processingandanalysis,methodsandtoolsfortheresultvisualization

oftourismbigdata,aswellastourismbigdataregardinggovernmentpublicservice

andmanagementinnovation,tourismenterpriseinnovation,etc.,providingguidance

fbrstudentstofullyunderstandtourismbigdataanddeveloptheabilitytoapplytourism

bigdata.Thisbookalsoexpoundsnewissuesinvolvingbigdatathinkingandtourism

innovationanddevelopment,tourismbigdataethicsandgovernance,andhighlights

thebasicapplicationofbigdataintourismstatisticsandtouristportraits,providing

supportfortheoreticalexplorationandtalenttrainingaimedatpromotingthe

constructionofamoderntourismsystemwiththenewelementsofdata.

三、课程目标

课程目标所支撑的培养要求

程目建立旅游大数据准确理解旅游大数据相关的基本概念:大数

标1

知识体系据、旅游大数据及其特点

熟练把握旅游大数据的主要分析技术和典型

掌握旅游大数据应用:旅游大数据采集与预处理、旅游大数据

标2主要分析技术和存储与管理、旅游大数据处理与分析、旅游大

典型应用数据可视化方法和工具,以及大数据的旅游统

计应用、旅游大数据与游客画像等。

了解旅游大数据认识了解旅游大数据发展概况:旅游大数据兴

的发展趋势和理起及其理论进展、大数据思维与旅游创新发

课程目

标3论进展、伦理与治展、旅游大数据的伦理与治理。思政内容:爱

理、大数据思维国主义教育

注:1、工程教育类、师范类认证专业可根据认证要求自行设计本表;

2、须包含课程思政目标。

四、课程内容

第一章旅游大数据概况

课内学时数:

2学时

课外学时数:

教学目标:

1.掌握大数据、旅游大数据的内涵及特征。

2.认识大数据的来由及处理的基本流程。

3.了解旅游大数据的主要类型和典型应用。

4.了解发展旅游大数据的重要意义。

教学重点:

1.大数据是无法在一定时间范围内用传统数据架构和传统计算工具有效处

理的新数据集,是需要新处理模式才能具有更高价值维度的海量、高增长性和多

样化的信息资产。大数据具有4V特征,即规模性(Volume)、多样性(Variety)、

高速性(Velocity),价值性(Value)。通俗地说,就是大数据的数量很大、结

构很复杂,生产和计算的速率很快,有价值的信息占比低。

2.大数据处理的基本流程主要包括数据采集与预处理、数据存储和管理、数

据处理与分析、数据结果呈现(含可视化)等环节。

3.旅游大数据是大数据在旅游领域的投射,一般指其他旅游参与主体及游客

所产生的数据及旅游地理、气候等数据,包括景区、酒店、旅行社、导游、游客、

旅游企业等产生的管理或业务数据,旅游行业所产生的管理或者业务数据,旅

游行业基础资源信息库,互联网数据、旅游宏观经济数据、旅游气象环保数据、

交通数据、网络舆情数据等,其中游客的数据最为重要、应用价值较大。旅游大

数据除了具有大数据典型的4V特征外,还具有多源异构、时空属性、多尺度与

多粒度及主体复杂性等特征。

4.旅游大数据应用有三个方面,即面向旅游企业的典型应用、面对旅游管理

部门的典型应用和面向游客的典型应用。面向旅游企业的典型应用主要包括利用

旅游行业数据分析,提高旅游企业服务质量;通过数据挖掘分析,指导企业运营

管理。面对旅游管理部门的典型应用主要包括应用大数据工具辅助科学决策和战

略定位,改进目的地旅游营销。面向游客的典型应用主要是旅游消费场景和旅游

服务场景,丰富游客在旅游场景中的消费体验,提高为游客服务的便利化水平。

5.发展旅游大数据具有重要意义,有利于提升游客体验和服务品质,有利于

优化旅游产品和服务供给,有利于激活创新链条,提升产业现代化水平,有利于

推进公共服务和行业治理现代化。

教学难点:

1.大数据与旅游大数据概念

2.旅游大数据的主要类型及典型特征。

3.大数据战略与数字经济发展。

教学内容:

大数据的诞生是信息技术进步的结果,直接推动了科学研究范式、思维方式、

商业模式和服务方式的巨大变革。旅游大数据是旅游从业者和管理者洞察旅游市

场需求、优化供需体系、提升管理绩效和现代化水平的重要工具。本章将从大数

据的概念及特点着手,引导学生了解大数据的基本概念、特征及其数据处理基本

流程和工具方法,逐步深入探索掌握旅游大数据的概念、特征、类型及其典型应

用,理解旅游大数据的兴起、理论进展,以及发展旅游大数据的重要意义。

学习效果检测要点:

1.什么是大数据?大数据的主要特点是什么?

2.旅游大数据有哪些典型特征?

3.旅游大数据有哪些典型应用?

4.发展旅游大数据的重要意义是什么?

第二章大数据思维与旅游创新发展

课内学时数:

2学时

课外学时数:

教学目标:

1.掌握大数据思维推动旅游创新发展的路径。

2.认识大数据思维推动旅游生产变革的逻辑思路。

3.了解大数据推动旅游社会治理变革的途径。

4.掌握大数据思维下旅游服务、营销和商业的创新模式。

5.了解大数据思维在旅游应用中的若干误区。

教学重点:

1.大数据思维主要从旅游知识体系、要素体系、组织管理、生产方式、社会

治理等方面推动旅游生产变革。

2.大数据思维主要从服务模式、营销模式、商业模式等方面推动旅游创新

发展。

3.大数据思维下旅游服务模式创新表现为精细化服务新模式、一站式服务

新模式、智能化服务模式等。

4.大数据时代旅游企业商业模式创新思维主要表现为在价值网络中加入

不同的合作伙伴,创造出不同的价值传递路径,从而迭代出丰富的商业模式。

5.大数据过度“神话”导致的旅游大数据认识误区有数据并非越多越好、

大数据并不能包揽一切信息、大数据并不只研究相关性、大数据并未完全消除个

体差异、大数据不应主张“可视察性”、大数据应用并不都是划算的生意等。

教学难点:

1.大数据思维推动旅游创新发展的路径。

2.大数据思维推动旅游生产变革的逻辑思路。

3.大数据思维下旅游服务、营销和商业的创新模式。

4.大数据推动旅游社会治理变革的途径。

5.大数据思维在旅游应用中的若干误区。

教学内容:

大数据颠覆了传统的统计思维和方法,已成为旅游经济增长的重要生产要素,

加快了旅游知识体系变革,彻底改变传统旅游企业的生产方式,重塑了企业组织

方式,推动生产结构由传统的“金字塔”形向“去中心化”“去中介化”“去金字

塔式”转变。大数据激发了旅游商业思想、服务方式、营销方式、商业模式等创

新思维,推动社会治理模式从单向管理向双向互动,从线下转向线上线下融合,

从单纯的政府监管向更加注重社会协同治理转变,为旅游业高质量发展驶入快车

道提供栗素支撑。大数据在推动旅游创新发展的同时,仍存在过度“神话”的认

识误区,政府部门、业界、学界需树立正确的大数据观,科学认识大数据,推动

旅游大数据科学应用。本章从旅游知识体系、要素体系、组织管理、生产方式、

社会治理等方面介绍了大数据思维对旅游生产变革的推动作用,并从服务模式、

营销模式、商业模式等方面介绍了大数据思维对旅游创新发展的影响,同时介绍

了大数据思维在旅游应用中的若干误区等知识点。

学习效果检测要点:

1.大数据使旅游知识体系发生了哪些变化?

2.大数据作为生产要素是如何推动旅游生产方式转变的?

3.大数据如何加快旅游创新发展?

4.大数据如何促进旅游业的跨界融合创新?

5.大数据为旅游企业提供了哪些商业思维创新?

6.旅游企业在大数据时代如何创新服务模式?

7.大数据如何重构旅游营销模式?

8.在大数据背景下,有哪些旅游商业营利新模式?

第三章旅游大数据伦理与治理

课内学时数:

4学时

课外学时数:

教学目标:

1.掌握大数据技术伦理的基本概念。

2.认识大数据技术伦理产生的背景及旅游大数据技术中的伦理问题。

3.理解旅游大数据伦理问题的根源。

4.了解旅游大数据伦理治理的原则和维度。

教学重点:

1.大数据伦理的产生一方面源于互联网技术演变催生的大量异构数据的不

断产生,另一方面在于行业管理部门、企业商业及个人的信息技术应用与使用等

为大数据采集提供了更多的手段与渠道。

2.每一次科学技术领域的重大突破与进展都会对人们的思维方式、行为方

式以及价值观念带来不同程度的冲击,尤其是会产生一些新的伦理观念,同时也

会带来一些新的伦理问题,在处理这些新问题的时候,人们的伦理观念就会得到

提升。在大数据技术迅速发展的同时,加强伦理的思考与规范迫在眉睫。

3.大数据技术在实际应用的过程中普遍存在着伦理困境:数据开放共享与数

据泄露、隐私保护的困境;公共福利与数字鸿沟的困境;公共善与数据失真、数

据失信的困境;技术异化与人性自由的困境。

4.旅游大数据应用有其自身的行业特征,旅游本身的移动性,所处环境的非

惯常性,以及旅游电子商务应用的普遍性等,使得旅游大数据中的伦理问题体现

出自身的特征。主要包括:隐私泄露与数据安全问题、个人信息的过度采集与拒

绝服务问题、数据歧视问题、数据失信问题等。

5.旅游大数据伦理问题的产生来自于多方面,包括技术性根源(涉及数据采

集、数据取舍、数据处理、数据安全等方面)、主体性根源(主体的多元性、复

杂性)、社会性根源(法律机制不健全、伦理规范不统一、社会监督机制缺失)3

个方面。

6.旅游大数据的治理是一个系统工程,需要通过促进社会、行业组织、公共

部门以及学术界利益相关者的合作,不再是政府单一、单向监管,而是多主体协

同。主要包括法律维度、技术维度、管理维度的全方位治理来推进治理的进程和

效果,平衡技术创新带来的利益与风险。

教学难点:

1.大数据伦理问题的困境。

2.旅游大数据中的伦理问题。

3旅游大数据伦理问题产生的技术根源。

4.旅游大数据的伦理治理维度。

教学内容:

随着数字经济的快速发展,全球进入数据爆炸时代,数据在社会发展、民众

生活中扮演起了越来越重要的角色。大数据技术为我们的经济社会、旅游产业发

展带来巨大变革的同时,也随之产生了有违人性、道德等的伦理问题,而这些问

题已经逐步显现并为社会和产业带来了较大的负面影响,需要引起我们足够的重

视。本章主要通过对大数据伦理问题产生的背景、困境与问题、产生的根源以及

治理的方法与措施等几个方面来构建旅游大数据伦理的知识与内容体系。大数据

技术本身是伦理中立的,没有价值框架,然而作为社会主体的个人和企业等却都

具有价值系统,我们有责任和义务去了解这些伦理问题产生的现象、背后的原因,

以及治理的原则与方法,从而采取广泛而有效的措施加以防范和规避,确保大数

据技术以符合我们正确的价值观、伦理观的方式加以运用,同时又能不遗余力地

发挥其真正的潜力和价值,推动旅游事业乃至人类社会的不断进步。

学习效果检测要点:

1.通过本章的学习,请你谈谈你都遇到了哪些旅游大数据伦理相关的问

题?这些问题又能如何规避或有效地解决?

2.你认为旅游大数据伦理问题产生的原因有哪些?

3.为什么说旅游大数据伦理问题需要治理?

4.旅游大数据伦理治理的原则和维度有哪些?

第四章旅游大数据采集与预处理

课内学时数:

6学时

课外学时数:

教学目标:

1.了解旅游大数据采集来源。

2.了解旅游大数据采集方法。

3.了解旅游大数据预处理的目的。

4.掌握常用的旅游大数据采集工具。

5.掌握旅游大数据预处理流程与方法。

教学重点:

1.旅游大数据生产指对旅游相关的真实世界的物理条件进行测量并得到数

据的过程,被生产出来的旅游大数据称为旅游大数据源。旅游大数据由人、机构、

机器或设备生产。

2.旅游大数据采集来源主要分为旅游应用内部和旅游应用外部,包含互联

网数据、广播电视数据、旅游者位置数据、消费数据、搜索数据、投诉数据和预

订数据等。

3.旅游大数据采集方法包括互联网数据采集、基于ETL的大数据采集、基

于接口的数据采集、日志流数据的采集、基于设备和物联网传感器的采集。

4.常用的旅游大数据采集工具包括编写数据采集程序的计算机语言(Java、

Python等)、爬虫框架及工具产品(基于Python,Java等编程语言的爬虫框架

和爬虫软件),ETL工具和分布式数据采集架构。

5.数据质量的优劣直接影响数据价值的高低,进而影响人们的分析和决策。

大数据预处理技术能够保证数据的准确性、完整性、一致性、时效性、可信性和

可解释性。

6.旅游大数据预处理流程包括数据清洗、数据变换、数据集成、数据归约、

数据标注等步骤。

教学难点:

1.旅游大数据采集方法。

2.旅游大数据预处理的目的。

3.常用的旅游大数据采集工具。

4.旅游大数据预处理流程与方法。

教学内容:

旅游大数据采集与预处理是进行数据挖掘、分析并辅助决策的基础。旅游大

数据或数据规模大,或数据结构复杂,或数据产生及变化的速度快到以秒来计,

其采集过程和方法不同于传统的旅游数据。旅游大数据也存在所采集的原始数据

错误、冗余、缺失、不一致等问题。这样的数据不能直接用于数据分析和挖掘,

需要进行数据预处理以消除数据存在的问题,提高数据质量。本章内容主要学习

旅游大数据的采集来源、流程、方法及常用工具,旅游大数据预处理的目的、流

程与方法,主要包含数据清洗、数据变换、数据归约、数据集成以及数据标注等

问题。

学习效果检测要点:

1.旅游大数据都有哪些生产主体?

2.旅游大数据源都有哪些?景区如何获取这些数据?

3.常用的数据采集工具有哪些?各适用哪些不同场景?

4.数据预处理的目的是什么?

5.数据清洗的意义是什么?主要方法有哪些?

6.为什么要进行数据变换、数据归约、数据集成?

7.数据标注的语法标注和语义标注分别指什么,请举例说明。

第五章旅游大数据存储与管理

课内学时数:

6学时

课外学时数:

教学目标:

1.认识旅游大数据共享的现状、挑战和趋势。

2.了解大数据存储的主流工具。

3.了解数据科学与旅游业结合的应用场景。

4.理解大数据管理的重要理念和思维方式。

5.理解大数据存储的重要思想和主要技术。

教学重点:

1.数据管理技术发展经历了4个阶段:人工管理阶段、文件系统阶段、关系

型数据库占主导阶段和NoSQL崛起阶段。

2.常见的数据处理方式有OLTP和OLAP两种。0LTP(0n-lineTransaction

Processing)指联机事务处理,也称操作性处理,OLAP(On-LineAnalytical

Processing)指联机分析处理,也称分析型处理。

3.旅游大数据领域的数据孤岛现象依然严重,数据共享依然面临重要的挑战。

4.现有的文件存储系统一般分为集中式存储与分布式存储两种,在大数据时

代,分布式存储逐渐成为主流。

5.数据管理的架构是数据管理的顶层设计、是数据管理中制度的制定和执行,

其技术应用是人、数据和工具在制度规范和在技术支撑下的融合。

教学难点:

1.关系型与非关系性数据库的区别。

2.关系型数据库的概念与应用。

3.非关系型数据库的概念与应用

4.集中式存储与分布式存储。

5.旅游大数据的发展与挑战。

教学内容:

旅游大数据的存储与管理是进行数据分析、挖掘的基础。本章从历史、技术、

应用等多方面,分别对旅游大数据的存储与管理进行了介绍。旅游大数据的存储

主要讲述了旅游大数据存储的发展阶段、存储的类型与架构,从文件存储到数据

库存储,从关系型数据库到非关系型数据库L、由OLTP到OLAP、由集中到分

布、由大数据平台到数据中台等旅游大数据存储的基础知识,并举出了其代表性

产品。在旅游大数据共享与管理部分,分析了旅游大数据共享的现状、面临的挑

战与趋势,并从架构、策略和保障等维度梳理旅游大数据管理的重要理念和思维

方式。

学习效果检测要点:

1.数据管理技术发展经历了哪四个阶段?

2.常见的关系型数据库有哪些?

3.关系型数据库与非关系型数据库的优点与缺点各是什么?

4.常用的数据存储架构有哪两种?

5.为什么大数据存储技术能淘汰传统意义上的存储技术?

6.有哪些代表性的大数据平台?

7.旅游业有哪些大数据应用?

8.旅游大数据共享面临哪些挑战?

9.数据管理的保障有哪些?

第六章旅游大数据处理与分析

课内学时数:

6学时

课外学时数:

教学目标:

1.了解旅游大数据处理的主要技术及其应用范围

2.区分不同种类大数据处理技术的差异

3.了解旅游大数据分析的主栗方法及其分类

4.了解旅游大数据分析方法的应用场景

5.熟悉几类常见的旅游大数据及其应用实例

教学重点:

1.大数据处理技术的核心是快速和实时,由此产生了以Hadoop和Spark

为代表的大数据批处理计算系统和以Storm、SparkStreaming、FIink等为代

表的大数据实时计算系统。此外,图计算和查询分析计算也因大数据处理的需要

产生了优于传统技术的实时或准实时的技术。

2.大数据批处理解决方案的核心思路是:在数据不动的情况下将程序分发

到数据所在的地方进行计算,被称作“移动计算而不是移动数据”。批处理的常

用框架包括Hadoop和Spark。Hadoop是一个分布式系统基础架构,用户可以在

不了解分布式底层细节的情况下,开发分布式程序,并充分利用集群的威力进行

高速运算和存储。相对于Hadoop,Spark拥有更快的执行速度和更友好的编程接

口O

3.根据方法的原理可以将现有的旅游大数据分析方法分为描述性分析、数

据挖掘、机器学习、文本挖掘和网络挖掘。

4.描述性统计分析是从定量的角度去探索数据,也是最基本的数据探索方

式,其主要目的是了解数据的基本特征。数据挖掘是从存储的旅游大数据中自动

地发现有价值的信息和知识的过程o数据挖掘与传统的数据分析(如查询、报表、

联机应用分析)的本质区别是数据挖掘是在没有明确假设的前提下去挖掘信息、

发现知识。机器学习是专门研究计算机如何模拟人类的学习行为,以获取新的知

识或技能,重新组织已有的知识结构使之不断改善自身性能的学科。

5.文本挖掘是把非结构化数据转化为结构化数据并对其进行分析的一种人

工智能技术。网络挖掘是面向数据密集型Web系统的数据分析技术。

教学难点:

1.各种旅游大数据处理技术的原理。

2.各类旅游大数据分析方法的原理。

3.各类旅游大数据分析方法的应用实践。

教学内容:

旅游大数据的产生为旅游行业的发展以及旅游研究的进步带来了机遇,同时

也使数据处理技术和分析方法面临新的挑战。如何快速的处理大量数据和从大量

数据中获取有效信息是大数据处理和分析需栗解决的问题。批处理计算、实时计

算等技术是随着大数据产生而出现的新的数据处理技术。而数据分析并非一个新

的概念,在大数据产生以前就存在。大数据产生之前和之后所采用的分析方法并

没有本质区别,但大数据出现之前数据分析所采用的工具已经不适用于大数据分

析[1],几乎所有大数据分析都需要通过编程来实现。旅游大数据分析的核心是

其所采用的数据分析方法,同样的数据分析方法可用于分析不同类型的旅游大数

据,同一类型的旅游大数据因应用目的的不同也可以采用不同的数据分析方法。

只有对各类旅游大数据分析方法的特性、适用范围有足够了解,对旅游大数据的

类型和不同类型数据的特征及其应用目标有足够了解,才能在实践中灵活运用旅

游大数据分析,更好地服务于旅游管理,提高游客的旅游体验。本章主要介绍旅

游大数据处理与分析的相关技术和方法。

学习效果检测要点:

1.实时计算被业内人士普遍看好,你认为将来大数据流计算系统会完全替代

其他非实时的大数据计算系统吗?

2.数据挖掘的概念、特征是什么?

3.数据挖掘的算法分为哪几类?

4.机器学习的概念是什么?

5.机器学习的算法主要有哪些?

6.大数据和小数据在数据分析上有什么不同?

第七章旅游大数据可视化的方法与工具

课内学时数:

6学时

课外学时数:

教学目标:

1.了解数据可视化的基本概念。

2.了解数据可视化的意义。

3.了解当前主流的数据可视化方法。

4.掌握基础的数据可视化方法。

5.通过案例了解数据可视化应用。

教学重点:

1.数据可视化是将数据转化为信息、信息转化为知识,创造数据价值、感

知数据价值和传递数据价值的过程。

2.数据的价值是存在于客观事件的数据规律中的,是来自对数据规律的感

知力和洞察力。

3.数据可视化的目标主要有清晰易懂、折射关联、生动形象、提供交互四

个主要方面。

4.旅游大数据可视化根据数据类型可以分为四类:基础数据可视化、文本

数据可视化、时空数据可视化和社交网络数据可视化。

5.数据可视化工具主栗分为三类:软件工具、Web开源工具、编程实现工

具。

教学难点:

1.数据可视化的作用与核心价值。

2.数据可视化的目标和功能实现。

3.旅游大数据可视化的特征以及分类。

4.数据可视化的工具掌握以及应用。

教学内容:

数据可视化借助图形化手段清晰有效地传达与沟通信息。随着计算机和互联

网技术的发展,数据量越来越大,数据类型和数据可视化的方式越来越多。数据

类型大体可分为基础数据、文本数据、时空数据和社交网络数据,不同类型的数

据有不同的可视化方式,数据可视化可以利用ExcelsECharts、Python进行开

发。旅游大数据可视化所面对的是旅游行业海量的多维异构数据,通过数据可视

化展示,可降低数据信息传达的成本,提升对数据规律洞察的可能性,帮助用户

发现数据背后的价值,即让用户能够更快地进行科学决策或行动。以杭州旅游大

数据系统为例,可以了解数据可视化在成熟的大数据决策系统中的应用、发展和

演变路径。

学习效果检测要点:

1.结合实例,谈谈如何理解旅游大数据可视化的价值?

2.在进行旅游大数据可视化设计时,如何通过交互让数据价值最大化?

3.你认为好的旅游大数据可视化设计该具备哪些要素?

第八章大数据的旅游统计应用

课内学时数:

6学时

课外学时数:

教学目标:

1.了解大数据与旅游统计之间的关系。

2.熟悉旅游大数据统计的基础理论以及存在的误区。

3.掌握大数据统计旅游客流的方法和技术规则。

4.了解旅游收入统计技术定义和大数据源采集。

5.了解大数据在旅游资源及产业分布、专项旅游市场监测方面的应用方法。

教学重点:

1.大数据不是绝对的“大”,而是相对的“大也就是说,大数据既不要求

全样本,也不强求样本量不顾现实条件的约束一味追求越大越好。

2.游客与旅客、访客存在概念上的差异。游客需要从离开惯常环境、出游动

机等方面加以定义。大数据在旅游领域的多数应用,游客识别是必要前提,就需

要明确惯常环境的技术定义,以及弄清楚位置大数据如何识别惯常环境。

3.传统旅游统计主要是通过抽样调查与填报等方法“以小见大”,有样本推

算整体。大数据旅游统计,则在收集多源异质异构海量数据的基础上,依托计算

机的强大算力进行挖掘分析,去掉非旅游‘'噪声",实现“由大见小两者各有

优劣,应相互补充而不是替代。

4.很多涉旅大数据实际上是终端设施设备数据,SIM卡位置数据不一定代表

办卡人的轨迹,车流数据与客流数据不能等同,POS机收单数据也不一定能准确

表达刷卡者个人的消费水平和习惯,等等。将终端设施设备数据关联为人的移动、

消费等行为数据,需要利用算法或统计抽样等方法科学处理。

教学难点:

1.惯常环境应如何理解和界定。

2.不是全样本的大数据怎么用。

3怎么按照游客定义进行大数据噪声剔除。

4.既有涉旅大数据难以识别出游动机,怎么结合抽样调查进行剥离;

教学内容:

大数据在旅游统计中的应用对提高数据的透视作用,弥补传统旅游统计的时

滞长、样本小、信息量少等方面有明显作用,可是实现使用同样的数据源、相同

的算法和口径对全国旅游市场进行同维度时空挖掘,大大提高数据之间的横纵向

可比性。目前,业界普遍使用大数据进行节假日客流统计、目的地旅游消费监测、

专项市场客流流量流向监测等工作,但监测方法不一、口径各异。充斥着“拿来

主义”和唯技术论,根据大数据提供商技术人员的“想当然”进行人次、客源结

构等指标的统计,造成普遍性谬误。本章从解答大数据统计与传统统计的关系、

旅游大数据统计的基础理论和存在的误区等重要议题入手,阐述大数据在旅游客

流统计、旅游收入统计中的应用中的基本规则要求,呈现当前大数据在旅游资源、

产业分布、专项旅游市场监测、游客行为分析等非法定旅游指标监测中的创新应

用,有助于加深对游客的基本概念,和对传统旅游统计和大数据统计应用的学理

性理解。

学习效果检测要点:

1.游客的学术定义和技术定义分别是什么?

2.目前全国和地方是怎样进行旅游统计的?

3.国家和地方旅游统计口径有什么不同?

4.大数据统计与传统旅游统计之间的优劣和关系?

5.大数据为什么不一定是“越大越好”?

6.怎么理解惯常环境?

第九章大数据与游客画像

课内学时数:

6学时

课外学时数:

教学目标:

1、掌握游客画像的定义、目的和意义

2、了解游客画像构建流程

3、了解基于位置数据的游客识别流程

4、了解游客画像的常用维度和识别方法

5、了解游客画像的主要应用场景

教学重点:

1.用户画像的概念是由交互设计之父艾伦•库伯(AlanCooper)最早提出,

用户画像(persona)是指用虚拟化的代表来标识真实存在的用户,是建立在一

系列真实数据之上的目标用户模型,用于产品需求挖掘与交互设计。用户画像的

核心工作就是给用户打标签,标签通常是人为规定的高度精炼的特征标识,是基

于业务系统运行产生的数据建立的用户模型,也可以称作用户信息标签化。

2.游客画像是用户画像(userprofiIe)在文旅消费领域的应用,是对游

客特征细分偏好画像、消费特征画像等。是游客人口统计学信息、地理位置、消

费行为和线上行为等信息抽象出来的标签化表达。

3.国内游客是指离开惯常环境,到国内其他地方从事参观、游览、度假等

旅游活动,出行距离超过10公里,出游时间超过6小时,但不超过12个月

的我国大陆居民。

4.游客画像生产流程:源数据收集(数据源包含了PC浏览日志,移动APP

日志,线下行为数据,营销日志,社交行为数据,身份数据,LBS数据,信令数

据等):标签体系建立(标签体系的建立要以文旅产业的应用场景为导向,依据

实际的业务需求去构建。);用户行为建模(行为建模从技术角度分为两大类,第

一类是规则型画像;第二类为挖掘型画像)。

5.旅游大数据游客分析(1、游客识别要素;2、游客数据来源;3、游客识别

流程)。

6.游客画像的常用维度(游客属性画像识别;游客兴趣偏好画像识别;游

客游憩行为画像识别;游客细分偏好画像识别;游客消费特征画像识别)。

教学难点:

1.用户行为建模的生产流程。

2.游客识别的五个关键业务步骤。

3.游客画像常用维度的识别方法。

4.游客画像的主要应用场景。

教学内容:

旅游大数据分析的重要基础是对游客特征的抽象,包括游客的身份特征、兴

趣偏好特征、时空行为特征等,通过这些特征的数据定义,实现游客从真实世界

向数字世界的映射和挛生,从而支撑上层应用的设计实现,这些特征的集合就是

所谓的游客画像。本章第一部分主要详细阐述游客画像的定义、目的,以及从应

用场景、成本效率和隐私安全等综合因素阐述游客画像建设的必要性。第二部分

主要介绍了通用的画像标签体系的技术实现路线,以及游客画像的通用生产流程

进行概要介绍,进而描述了基于位置数据的时空建模和游客识别,并对游客兴趣

偏好、游憩行为、细分偏好、消费特征等画像体系进行阐述。最后,对游客画像

的主要应用场景和价值进行概述,通过本章的阅读,将帮助读者建立基于多源异

构的数据抽象出统一游客模型的思维模式,从而更透彻的理解和掌握本书后续章

节展开的相关数据应用的底层逻辑。。

学习效果检测要点:

1.旅游大数据游客分析中游客识别要素是指什么?

2.旅游大数据游客分析中游客数据来源有哪些?

3.旅游大数据游客分析中游客识别流程的五个关键步骤包括哪些?

4.游客画像识别的五个维度包括哪些?每个维度主要包括什么内容?

5.于游客画像在文旅行业应用赋能主要包括哪些应用方向?

第十章大数据与旅游企业创新

课内学时数:

2学时

课外学时数:

教学目标:

1.了解大数据驱动旅游企业创新的维度。

2.掌握企业如何依托大数据构建自身的创新能力。

3.了解大数据驱动旅游企业创新的主要应用场景。

教学重点:

1.大数据主要从价值维度、关键业务和流程创新、成本结构和收益模式创新

以及外部关系网络和价值网络重构等维度驱动旅游企业创新。

2.企业可以从重构企业的大数据资源整合能力、大数据存储和处理能力、大

数据深度分析挖掘能力、大数据智能实施和商业洞察能力等方面来构建企业大数

据能力。

教学难点:

1.大数据驱动旅游企业创新过程的具体维度。

2.旅游企业构建自身的大数据能力的途径。

教学内容:

需求牵引供给,供给创造需求。随着互联网、云计算、大数据、人工智能等

信息技术的飞速发展,依托现代化的新技术和新装备推动旅游企业创新助力旅游

业高质量发展,成为新时期旅游业发展的趋势。在这一进程中,大数据不仅改变

了游客的消费偏好、消费决策和消费行为,还改变了游客对目的地信息获取和支

付的方式。大数据通过数据整合、智能分析、系统优化等功能为产业链的战略定

位、项目投资、产品研发、分销渠道等环节的提质增效发挥着积极作用,还在创

造新的旅游业态、新的旅游需求,引导新的旅游消费,推动服务方式和商业模式

创新等方面发挥着重要作用。

学习效果检测要点:

1.大数据驱动旅游企业创新过程的具体维度是什么?

2.旅游企业如何构建自身的大数据能力?

3.大数据驱动旅游企业创新的主要场景有哪些?

第十一章大数据与旅游公共服务及管理创新

课内学时数:

4学时

课外学时数:

教学目标:

1.掌握大数据对旅游规划及宏观决策的具体作用。

2.认识基于大数据的旅游公共服务与管理为游客旅游带来的便利作用。

3.了解大数据如何提升旅游市场治理能力。

4,了解大数据如何实现旅游目的地的精准营销推广。

5.认识大数据时代下的旅游发展趋势。

教学重点:

1.大数据在文化和旅游规划中的具体作用主要表现在识别并洞察客源市场

及发展机遇,基于相关大数据进行游客喜好的画像,并为旅游资源与设施的布局

与规划等提供数据支撑,辅助评估旅游市场潜力,确立旅游规划方向。

2.大数据时代下,旅游宏观决策的支持系统要求升级,包括科学性决策需求、

复杂性决策需求、敏捷性决策需求、友好性决策需求。

3.旅游公共信息服务平台是旅游公共服务供给体系的基础o在移动互联网技

术的普及下,旅游公共信息服务平台要适应即时、碎片化的旅游资讯需求,能精

准快速地把有效信息推送给有效人群,实现对游客的精准信息服务。

4.基于大数据的旅游市场治理主要包括旅游舆情监测与旅游行业监管、客流

监测与预警两大内容。

5.大数据时代下旅游目的地营销持续升,在全方位进行旅游目的地品牌评估

(基于大数据前提下,分析旅游目的地形象认知度、评价旅游目的地品牌认可度、

用大数据旅游分析旅游目的地品牌感知),通过大数据(客源市场和竞争对手的

数据)分析,针对性进行旅游目的地营销及迭代升级。

教学难点:

1.新型旅游公共服务的总体特征。

2.旅游市场治理的表现形式。

3.大数据下旅游目的地营销方式。

4.大数据下旅游宏观决策的主要形式。

5.大数据时代下旅游发展的主要趋势。

教学内容:

随着互联网、物联网、大数据、人工智能、5G等高新技术的发展,通过大

数据对旅游产业及旅游市场的挖掘分析,为文化与旅游规划、旅游宏观决策、旅

游政策制定、旅游产业优化提供量化决策的科学依据。随着信息技术的发展,基

于大数据的旅游公共服务与管理趋向数字化、网络化、智能化,便于为游客提供

更便捷、更智能、更精准的公共服务。结合大数据的旅游市场治理,可以实现产

业运行监测、智能化应急指挥调度,提高旅游管理者的监测效率与旅游市场治理

能力,利用大数据为旅游事务办理、信用管理、市场监管、安全监控等提供强大

的数据支撑和科学依据,增强旅游公共服务与管理的针对性、科学性和时效性。

此外,利用大数据可以改变传统的旅游目的地营销方式,通过大数据实现旅游目

的地的精准营销推广。本章从旅游规划与宏观决策、旅游公共服务、市场治理、

旅游目的地营销等方面介绍大数据在旅游公共服务及管理中的创新应用。

学习效果检测要点:

1.旅游公共服务通常使用的大数据有哪些?包括哪些部门数据?

2.试阐述旅游市场数字化治理的特点。

3.在出现突发性旅游负面舆情时,应该怎么处理?

4.大数据在旅游目的地形象建构中可以发挥哪些作用?

5.基于大数据的旅游目的地形象评估主要包含哪些基本内容?

6.大数据背景下如何开展营销推广评估?

7.大数据在旅游宏观决策中可起到什么作用?

8.新型旅游公共信息服务具备哪些特点?

9.旅游市场治理中常见的大数据应用有哪些?

10.旅游目的地营销的大数据来源主要包括哪些?

第一章

阅读案例

“百度迁徙”大数据

“百度迁徙”最早来源于“百度地图春节人口迁徙大数据”,是百度在2014年春运期

间推出的技术品牌项目。当时,百度利用百度地图LBS开放平台、百度天眼,对其拥有的

LBS(基于地理位置的服务)大数据进行计算分析,采用创新的可视化呈现方式,在业界首

次实现了全程、动态、即时、直观地展现中国春节前后人口大迁徙的轨迹与特征。2015年,

百度对“百度迁徙”进行了全面升级,形成了人口迁徙、实时航班、机场热度和车站热度四

大板块。百度迁徙动态图包含春运期间全国人口流动的情况与排行,实时航班的详细信息,

以及全国火车站、飞机场的分布和热度排行,通过百度迁徙动态图能直观地确定迁入人口的

来源和迁出人口的去向。基本原理如下图所示:

以春运人口迁徙密集、中国手机渗透率高为项目的大背景

原百度对拥有的定住大数据进行全样数据处理、分析和挖掘

数亿部手机定住数据变化,映射为人群迁徙轨迹并可视化

能数据技术创新

支拥有定位大数据拥有大数据技术为大数据实践找

且覆.盖面足够广能处理好大数据到创新应用方向

2015年“百度迁徙”还新增“百度天眼”功能。“百度天眼”是百度开发的一款基于百

度地图的航班实时信息查询产品。通过百度天眼,可以看到全国范围内的飞机实时动态和位

置,点击要查询的航班图标,还可以查看航班的具体信息,包括起降时间、飞机型号和机龄

等等。百度天眼的推出,将以往航班查询软件冷冰冰的航班信息变成了可视化的全图形界面,

不仅让接送机的家人和乘坐飞机归家的游子更加方便快捷地掌握到航班的最新信息,还能直

观地了解到航班当前所在的位置,这也是百度地图、大数据技术结合传统出行信息的全新呈

现形式。

2020年1月,''百度迁徙3.0”新上线迁徙趋势图功能,升级包括推出指定城市迁徙趋

势图功能:依次选择某一城市的“迁出目的地”或“迁入来源地”后,即可查看该城市春运

首日至昨日,该城市春运迁出、迁入人口的迁徙趋势。

作为一项创新项目,“百度迁徙”通过对大数据的创新应用,服务于政府部门科学决策,

赋予社会学等科学研究以新的观察视角和方法工具。目前,百度建立了百度迁徙平台,可供

全网实时查看全国及样本城市的实施迁徙状况。下图是百度迁徙平台的界面。

资料来源:百度百科,有删减。

案例分析

一、问题聚焦

该案例聚焦二个问题:1.位置大数据可视化图景如何产生?2.位置大数据的应用场景。

二、问题分析

1.位置大数据可视化图景如何产生:人们往往关注大数据的可视化呈现,从中能非常

便利并一目了然的观察迁徙人口的来源和签出的去向,但往往忽略这些可视化图景背后的数

据采集、存储、处理和分析。通过“百度迁徙”案例,我们可以看到可视化图景背后的基本

过程和能力支撑,基本过程包括,以基于百度地图的数亿部手机位置数据为基础,对定位数

据进行全样本数据、分析和挖掘,在通过算法映射人群迁徙轨迹并可视化的全过程。通过可

从互联网可接触、可获取的大数据应用实例,使读者能更加深入了解何谓大数据、大数据技

术及应用。

2.位置大数据的应用场景:案例中提及的“百度天眼”和“百度迁徙3.0”呈现了位置

大数据产品的主要应用。通过百度天眼,可以看到全国范围内的飞机实时动态和位置,点击

要查询的航班图标,还可以查看包括起降时间、飞机型号和机龄等等航班具体信息,方便旅

客出行,百度迁徙3.0”,可供全网实时查看全国及样本城市的实施迁徙状况,为旅客出行、

城市治理、涉旅治理等提供决策参考。大数据及其技术离我们的日常生活和生产很近,我们

平时没有想到的数据源通过大数据分析和挖掘,在不同场景应用,能大幅提高生产效率和生

活质量。案例呈现的大数据应用只是位置大数据挖掘及应用的部分场景,还有很多场景应用

有待开发。通过案例分享,可加深读者对大数据及其应用的认知,激发读者对数据挖掘和应

用学习的积极性,为促进旅游业大数据应用打下基础。

第二章

阅读案例

大数据时代旅游商业模式创新思维

令人垂涎欲滴的饕餐美食、心旷神怡的旅游景区、富丽堂皇的星级酒店……一个个网

红作为消费者亲身体验产品同时录制生动活泼的探店短视频让每一个观众都仿佛置身其中,

结合灵活的营销手段,大量观众点击进入购买渠道从观众变成消费者前往亲身体验。而这些

颜值高、性格好的网红频繁消费又是从何获利也成为了观众们的疑惑。

最初网红并没有很多粉丝,他们通过至少每天一更新的频率在平台与粉丝互动:“剧透”

即将探访的店铺,分享出游攻略,定时进行直播……以此来稳固“老粉”同时不断地吸引''新

粉”。待到粉丝达到一定数量使自己有了一定的知名度后短视频平台就会与这些知名网红联

系合作,许多商家甚至携程、马蜂窝等传统在线旅游平台也会依靠网红的影响力去寻求合作。

由此平台返利变成了他们主要收益来源,收益数量等于粉丝数量乘以信任度。

网红通过粉丝的信任度、在短视频平台的影响力以及社会知名度与消费者、商家、在

线旅游平台等多个主体建立起连接,并且不断刺激建立更多的连接,形成更稳固的结构,从

而承载更多价值。这就是连接的价值,只要建立起连接,价值会自然而然地涌现出来。处于

大数据时代的我们可以试想一下,面对如此众多的用户,是不是也可以借助大数据的方式,

对粉丝进行筛选和归类,以此来细分粉丝的喜好,更好的掌握他们的需求。

(资料来源:杜义飞等.潜模式:大数据时代下的商业模式创新思维[M].北京:科学出版

社,2018.)

案例分析

一、问题聚焦

该案例聚焦三大问题:1.“网红”是如何吸粉的?2.“网红”销售的是什么商品?3.

“网红”的价值是什么?

二、问题分析

1.“网红”是如何吸粉的:通过至少每天一更新的频率在平台与粉丝互动:“剧透”即

将探访的店铺,分享出游攻略,定时进行直播……以此来稳固“老粉”同时不断地吸引“新

粉”。这种吸粉方式其实是营销融合创新的一种方式,通过网络化或场景化的来设计方案,

在营销中更加注重满足消费者的场景价值需求。游客的消费行为可以在特定的场景下被激

发,游客也是透过场景来认知产品的,在不同的场景下具有不同的需求,将产品卖点与游客

需求相对接,有效地触动用户的痛点,引起消费者的情感共鸣,激发购买欲望,建立起良好

的互动关系,并形成消费者黏性和忠诚度。

2.“网红”销售的是什么商品:“网红”没有直接销售商品,他塑造的是一种IP人设,

通过大数据技术重新建构价值结构和交易场景,获取的不是直接销售产品的收入,而是广泛

的流量,是关系网络,通过大数据和交互,所有消费者都融入其中,并彼此联系,个人的积

极性被极大激发,从而愿意更加深度地融入和奉献于网络。

3.“网红”的价值是什么:“网红”的价值在于其广泛的流量所带来的价值网络,其价

值交换源于价值网络(拓扑结构),这一价值交换的网络中除了原有的顾客和厂商外,还增

加了广告商、商业伙伴、联盟企业等,由于价值网络的存在,不再需要两者之间进行价值交

换,而是参与的多方共同传递价值。这导致了价值的创造与价值实现相分离,游客价值创造

与企业价值实现不再具有高度的一致性。价值网络中加入不同的合作伙伴,创造出不同的价

值传递路径,就会迭代出丰富的商业模式。在网络结构中,参与商业模式构建的人越多,就

有更多价值实现的路径,也为模式创新提供更多创新整合的机会。

第二章

阅读案例

旅游景区采用人脸识别入园所引发的伦理问题

2019年11月21日消息,杭州野生动物世界将年卡中的指纹识别入园变更为人脸识别

入园,被法学博士出身的用户郭兵告上法庭,成为中国“人脸识别第一案”。

杭州富阳区人民法院20日一审宣判,判令杭州野生动物世界赔偿郭兵合同利益损失及

交通费共计1038元,删除郭兵办理指纹年卡时提交的包括照片在内的面部特征信息,驳回

郭兵提出其他诉讼请求。

案件源自2019年4月,原告郭兵支付1360元购买杭州野生动物世界双人年卡,确定

指纹识别入园方式。郭兵和妻子留存了姓名、身份证号码、电话号码等,并录入指纹、拍照。

但之后,野生动物世界将年卡客户入园方式从指纹识别调整为人脸识别,更换店堂告示,并

两次发送短信,通知郭兵激活人脸识别系统,否则将无法正常入园。郭兵认为,人脸信息属

于高度敏感个人隐私,野生动物世界无权采集,不接受人脸识别,要求园方退卡。园方则认

为,从指纹识别升级为人脸识别是为了提高效率。双方协商未果,郭兵提起诉讼,要求确认

野生动物世界店堂告示、短信通知中的相关内容无效,并以野生动物世界违约且存在欺诈行

为为由要求赔偿年卡卡费、交通费,删除个人信息等。

这起案件被媒体称作中国“人脸识别第一案”,以服务合同纠纷案审理。富阳法院认为,

案件争议焦点实际上是对经营者处理消费者个人信息,尤其是指纹和人脸等个人生物识别信

息行为的评价和规范问题。判决没有涉及野生动物园采用指纹识别或者人脸识别的方式入园

本身是否合法、正当、必要,而是根据合同是否符合约定来作出评判。法院认为,双方在办

卡时签订的是采用指纹识别入园方式的服务合同,野生动物世界征集郭兵夫妇的人脸识别信

息,超出了必要的原则要求,不具有正当性。尽管野生动物世界在指纹识别的年卡办理流程

中包括拍照,但并没有告知郭兵夫妇拍照就会完成对人脸信息的收集以及收集的目的。郭兵

夫妇同意拍照,不等于同意野生动物世界通过拍照收集两人的人脸识别信息。

法官表示:“综上,郭兵要求野生动物世界删除收集的其个人的人脸识别信息,理由正

当,应予支持。郭兵要求在第三方技术机构见证下删除信息,法律依据不足,不予支持。”

资料来源:根据CCTV-13新闻频道2021年04月10日的新闻直播间报道

案例分析

一、问题聚焦

该案例聚焦三大问题:1.个人隐私安全问题已开始受到社会关注⑵还需要进一步构建

更加完备的个人隐私保护体系;3.智慧旅游建设需要关注数字化伦理。

二、问题分析

1.个人隐私安全问题已开始受到社会关注。通过这个案例,我们可以看到,已经有人

开始关注个人隐私保护的伦理问题,试图通过法律的手段来保护个人隐私权。但普通的大多

数人则习焉不察,甚至习以为常。另一方面,园方等相关的旅游企业或组织还不具备相关的

数据伦理意识,还没有认识到这一问题所带来的潜在风险,相关的数据采集和处理流程亦不

规范,因而也引发了公众对于个人隐私信息泄露的担忧。人脸信息属于敏感个人信息中的生

物识别信息,是生物识别信息中社交属性最强、最易采集的个人信息,具有唯一性和不可更

改性,一旦泄露将对个人的人身和财产安全造成极大危害,甚至还可能威胁公共安全。

2.还需要进一步构建更加完备的个人隐私保护体系。由于当时的法律法规还不够健全,

参照和依据性不强,所以案件只是以服务合同纠纷案来进行的审理。同时本案件的二审判决

也只是增判野生动物世界删除郭兵办理指纹年卡时提交的指纹识别信息。对此,作为当事者

本人的郭兵对这个结果实际上并不满意。因为最关键的问题是没有第三方专业机构的认证,

无法确认具体是怎么删除的?他担心园方有没有可能利用他的信息去做别的事?虽然法院

作出了判决,但是如果没有保障,那么判决就会变成一纸空文。同时野生动物世界将人脸识

别作为唯一入园方式的要求也是不合理的。因此,在个人隐私保护和数据安全等领域,虽然

得到了国家和社会层面的重视,但还有待于多方的研究和努力,进一步细化法律条文和条款,

同时,除了法律层面的事后补救型措施,还必须同时启用事前监管,出台强制性标准,达到

标准规定的安全条件才能够应用此项技术,以便补强用户层面因“非接触性”以及缺乏维权

能力而导致的侵权泛滥。

3.智慧旅游建设需要关注数字化伦理。这一案例也给我们当前正在如火如荼开展的智

慧旅游建设敲响一个警钟。当前有很多目的地在建设智慧景区时将人脸识别技术引入到入园

时的认证检测,实现“刷脸入园”,从而提升游客入园的便捷性、体验感以及入园的效率。

但实际上这种方式也存在着成本高、游客人脸数据采集困难、人脸识别技术本身受光照、化

妆等因素识别不准确而须重复验证反而影响入园效率等多种问题和弊病,这种黑科技的应用

也似乎显得有些“鸡肋”。我们应该认识到,智慧旅游、智慧景区的建设不是技术的比拼,

而是景区管理和经营“智慧”的比拼。同时,我们的旅游目的地管理部门在当前推进智慧旅

游、“互联网+旅游”等的建设时,还需要补一门关于数字化伦理的课程。在进行人工智能、

大数据等相关技术的应用时,都要事先对可能引发的有关数字化伦理问题进行评估,对于数

据的采集、处理和存储等都要遵照一定的标准和流程,而不能只是想当然的随意处置。

第四章

阅读案例

故宫网络评论的采集与预处理

2017年2月分别选取以大众点评为代表的综合性社区网站、以携程为代表的在线旅行

社(OnlineTravelAgent,OTA),以及以马蜂窝为代表的旅游社交网站3种不同类型的旅

游在线服务网站,来采集故宫的网络评论。采集到大众点评论数7922条,携程38810条,

马蜂窝10525条。

对采集的原始数据进行了去重、去除无意义数据(广告,无意义的超短文本)等数据清

洗工作,最终获取到故宫的有效游客评论数19526条,其中大众点评7922条,携程1019条,

马蜂窝10515条。

采用中科院计算所张华平、刘群研制的ICTCLAS分词词性标注一体化系统,分词后共

得到1066474个词汇。采用一个较为通用的停用词表(含有2825个停用词)作为初始停用

词表去停用词;根据多次主题挖掘的实验结果对初始停用词表进行扩展,增加主题挖掘实验

结果中出现的对于主题分类无意义的高频词,如故宫、北京等。第三步,语义去重与合并。

利用Hownet合并相同含义的词或短语,先对预处理得到的数据集中所包含的特征词项进行

语义分析,通过词项相似度的计算,删除、合并语义相似的词项。经过上述预处理,分词后

26%的词汇被留下。

案例分析

一、问题聚焦

该案例回答如下问题:1、案例中的旅游大数据产生主体是什么?来自哪些数据源?属

于哪种数据源数据类别?2、案例可能采用了哪种旅游大数据采集方法或工具?3、案例的数

据预处理流程是什么?每一步骤的具体做法是什么?

二、问题分析

1.案例中的旅

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论