基于大数据挖掘的旅游分析_第1页
基于大数据挖掘的旅游分析_第2页
基于大数据挖掘的旅游分析_第3页
基于大数据挖掘的旅游分析_第4页
基于大数据挖掘的旅游分析_第5页
已阅读5页,还剩9页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

第一章绪论1.1研究背景近年来,我国旅游业呈现快速发展势头。在第三产业中,旅游业对有效促进我国经济全面发展具有十分重要的作用。旅游行业逐渐成为我国经济支柱产业之一,很多省市都在把发展重心向旅游产业转移。在旅游群体中,大学生是整个旅游市场的重要且独立的部分。大学生作为一个特殊的社会群体,具有一定的经济独立和自力更生的能力,时间比较悠闲,有冒险精神和追梦的梦想家,助长了大学生的旅游热潮。因此,大学生作为旅游产业的地位不容忽视。2020年疫情来袭,全世界都受到了疫情的影响,各个阶层都受到了疫情的影响,尤其是旅游业。而旅游业在这种情况下,要如何更好地进行面对大学生群体的发展,势在必行。近年来随着我国经济飞速发展,旅游业发展成为国内学术界探讨的热点话题之一。旅游业不断地细分目标市场,让大学生这一特殊群体在行业内成为了一块重要的消费人群。通过查阅相关文献后发现,对于出行旅游方面较多是围绕在旅游出行现状、旅游出行体验等方面进行研究,而对旅游决策的影响因素研究比较欠缺。本文以大学生为对象,对其旅游决策的影响因素进行实证分析,希望能补充这块研究欠缺,为以后更深入的研究提供一定参考借鉴。1.2研究目的本研究分析影响大学生出行决策的因素,利用问卷调查收集的大数据作为大数据分析的来源,并结合大数据挖掘技术的决策树和随机森林进行心理理解。了解大学生出行及出行决策过程,以及影响大学生出行决策的主要影响因素,并在其研究结果之上进行分析、讨论,希望能够为旅游行业从业者和经营者提供有价值的参考。1.3国内研究现状刘小嵌(2017)通过问卷调查的方式深入了解了年轻旅游者这一不断壮大的特殊群体的决策心理过程,分析出旅游企业需要为其提供心之所向的体验服务产品,真正做到满足这一特定游客群体的个性化需求[2]。赵鹏(2012)建立了影响大学生旅游消费行为的因素模型,通过假设检验证实了旅行前的旅行决策、旅行目的地感知和旅行动机与选择显着相关。[3]旅游目的地。郑海青(2017)使用了基于Scrapy框架的网络爬虫技术和基于BeautifulSoup的网页信息提取技术。从马蜂窝旅游网抓取了景点大数据结合问卷调查的方式,使用了结合了贝叶斯分类推荐和关联规则推荐的混合推荐算法具有较好的推荐准确率和覆盖度,能够满足对用户对景点推荐的需求[4]。目前国内学者对于大学生旅游决策影响因素分析的研究相对较少,且主要是通过问卷调查的形式,研究方法大多是采用简单的描述性统计分析和回归分析方法为主。本文将引入大数据挖掘算法(决策树、随机森林)来分析大学生旅游决策影响因素,希望能增补大学生旅游决策影响因素分析的研究方法。1.4研究工具与方法本文将使用决策树及随机森林两种算法作为基础算法,并以此来确定大学生旅游决策影响因素的影响大小。决策树是使用二叉树图来表示处理逻辑的工具。处理的逻辑要求可以直观、清晰地表达出来。特别适用于判断因素较少、逻辑组合关系不复杂的情况。随机森林是具有多棵决策树的分类器,输出类由它从每棵树输出的类模式决定。

第二章大数据挖掘概述2.1大数据挖掘定义1990年代出现的大数据挖掘,近来在信息产业受到高度重视,发展迅速,成为大数据时代各行各业的热点。所谓的大数据挖掘技术是指从大型数据库中隐含、嘈杂和随机揭示以前未知或潜在有价值的信息的简单过程[5]。大数据筛选和大数据预处理可以帮助决策者分析过去和现在的大数据,并以高度自动化的方式分析原始大数据进行归纳推理[6]。2.2大数据挖掘方法大数据挖掘分为引导式大数据挖掘和非引导式大数据挖掘。引导式大数据挖掘是使用可用的大数据来构建描述特定属性的模型。无向大数据挖掘正在寻找所有属性之间的某种关系。具体来说,分类、评估和预测属于引导式大数据挖掘,关联规则和聚类属于非引导式大数据挖掘。(1)分类首先从大数据中选择一个分类的训练集,在训练集上使用大数据挖掘技术建立分类模型,然后使用分类模型对未分类的大数据进行分类。(2)评价评价类似于分类,但评价的最终产物是一个连续值,评价量没有预先确定。评估可以作为分类的准备。(3)通过分类或评价训练得到模型的模型,通过分类或评价进行预测;如果该模型对一组测试样本的准确率较高,则该模型可用于未知变量;预测一个新的样本。(4)相关分组或关联规则,其目的是发现总是一起发生的事情。(5)聚类通过自动查找和设置分组规则,通过确定样本之间的相似性将相似样本划分为聚类[7]。2.3大数据挖掘流程大数据挖掘是从不完整、嘈杂、模糊和随机的大量大数据中提取隐藏的、未知的但可能有用的信息和知识的过程,有以下基本流程:(1)明确目标,在实施大数据挖掘之前,须明确通过大数据挖掘去解决什么样的问题。(2)大数据搜集,当明确了目标后,需要去搜集大数据,搜集的大数据即可以影响到这些问题的解决办法,大数据搜集决定了后期工作进程的顺利程度。(3)大数据清洗,搜集到的大数据来源是复杂混乱的,必须保证大数据的“干净”,因为大数据的质量高低将会影响最终结果的准确性。(4)构建模型,在保证大数据“干净”的前提下,需要考虑以什么样的模型能进行建模,以确保更好的解决问题,。(5)模型评估,即从已建立的模型中选择最佳模型的主要目的,是为了确保最佳模型更好地反映大数据的真实性。(6)应用部署,把从大数据挖掘中得到的规律运用到实际问题中去。

第三章大数据挖掘技术在智慧旅游中的应用3.1旅游大数据及挖掘在旅游业应用的必要性随着时代经济的高速发展和科技的发展,现代大数据的应用越来越广泛,当前国内的旅游业也在快速发展。大数据应用受到更多关注,旅游行业相关管理部门更加关注大数据的实际应用和研究现状。随着互联网时代的发展,旅游业发展迅猛,但旅游网站的精准设计往往会运用大数据技术,为当今的旅游出行提供必要的支持,推荐最佳旅游景点。当今旅游行业的旅游网站拥有超过5亿页的数据,旅游网站页面包括Hopper以及一些社交旅游网站和酒店综合搜索引擎。通过记录相关形成,做好平台的共享设计,加强游客与旅游业相关人员的联系,从根本上保障旅游业的全面快速发展。根据当今大数据信息的多样化,游客只需在网站上点击想去的旅游目的地,与旅游相关的吃、喝、住、行等生活必需品就会自动弹出。在实际的产品选择过程中,信息量很大,游客往往要自己做出选择和判断。同时,旅游大数据在旅游行业的应用和挖掘,通过提供这些数据,借助百度,及时的数据信息搜索和引擎,不仅保证了当前优秀的营销发展旅游行业,也保证了当前旅游行业以及企业的良好营销发展,正在影响着产业社会,对景区队伍的监控,对景区人数的监控起到了一定的积极作用。总体而言,旅游大数据与挖掘在旅游行业的广泛应用,不仅为现代旅游企业的快速发展提供了有利的加速,也为人们科学收集和获取旅游信息提供了一定的便利。它虽然可以准确预测客流趋势,但直接捕捉到游客的喜好,对提升现代旅游公共服务有非常有利的作用。因此,有必要将旅游大数据和挖掘应用到旅游行业。在旅游业中,在旅游大数据与挖掘的应用过程中,不仅实现了隐藏信息的挖掘,还提供了对现代旅游业发展具有重要意义的有价值信息,具体应用过程如下。3.2智慧旅游系统中结构和属性信息的数据挖掘由于当今复杂网络的广泛应用和数据源的增加,近年来复杂网络中的数据量呈爆炸式增长。旅游、大数据、云计算都是当下的热点,智慧旅游是我们关注的重点。旅游行业复杂数据的爆发式增长,加速了旅游大数据的产生,以及在智慧旅游系统中挖掘复杂网络数据的紧迫性。结合智慧旅游复杂网络模型中的结构信息、属性信息和信息流,是挖掘复杂网络数据的基础和关键。为了在高度复杂、非结构化的复杂网络中准确、高效地构建智慧旅游复杂网络的数据挖掘模型,需要从相对综合的复杂网络中收集和收集尽可能多的数据。它提取复杂网络的核心信息以抽象其节点、边及其属性。预处理复杂网络数据产生可用于数据挖掘的原始数据类型,包括来自复杂网络的静态数据和动态信息流数据。复杂的网络数据源,如智慧旅游,主要来自现实世界中挖掘的真实网络,包括社交网络中的话题、交通网络中的车辆、景区网络中的景点、旅行社网络中的旅行社等。这部分是来自复杂网络数据源的信息。智慧旅游中复杂网络数据挖掘的结构和性质分析主要体现在以下几个方面:(1)在云服务过程中,智慧旅游的属性价值主要是面向服务价值的整合创新,现阶段数据挖掘主要集中在物联网、云计算、大数据和移动互联网数据管理、资源共享、制度实施、实现改进。我们通过对智慧旅游系统服务准备阶段、服务进展阶段、服务结束阶段三个属性的分析,提升智慧旅游系统的人性化。(2)智慧旅游系统的结构挖掘主要是对传统旅游模式的重构。加强创新,以云计算为技术手段,提升服务理念。该过程主要是对旅游模式进行分解,将各个旅游节点置于一个复杂的网络环境中,对其进行分析,从根本上解决各个节点在时间和空间上的演化过程,从而有效提升游客的旅游体验。(3)智慧旅游系统中商业模式的性质,从购买传统旅游景点到电子商务的转变,改变旅游行程中的购物模式,这个模式的核心是对海量信息的精准处理,这是复杂网络数据挖掘的重点。(4)以游客为中心的智慧旅游系统中的旅游物业数据挖掘。网络中心对复杂网络进行节点分析,得到单个游客的位置以及复杂网络各节点所需的网络资源。链路预测通过记录用户在网络上的行为来改善用户访问体验。3.3智慧旅游系统中的协同过滤——推荐相似项在大数据时代,游客复杂的个性化需求和大数据的处理,使我们的旅游业进入了智慧旅游时代。智慧旅游是对整个旅游系统进行完善和提升,以满足游客的需求,从简单的旅游体验到不同的需求。推荐相似物品的问题主要从寻找具有大交集的集合的问题开始,在寻找过程中主要使用最小散列技术。智慧旅游的发展是一种创新,它在云计算环境下根据游客的个性指标做出有效的推荐,这是挖掘复杂网络数据的有效算法。为了解决这个问题,已经开发了地理感应散列技术,可以将搜索范围集中在可能相似的项目对上。在协同过滤中,系统向用户推荐具有相似兴趣的用户喜欢的东西。它首先找到一组可能的相似文档的候选对,然后基于这个集合,找到实际的相似文档。对智慧旅游系统中定制旅游云服务的选择进行协同过滤,通过技术手段为这些信息数据资源构建基于云平台的枢纽,进行信息组织和数据计算。智慧旅游控制中心提取复杂网络动态增长信息,进行大数据分析,通过移动互联网将分析结果可视化,为游客提供精准的旅游信息。在模糊项目的协同过滤-推荐过程中,选择最小哈希签名长度,并检查每个候选对的签名,以确定一致性比是否高于某个值。智慧旅游系统采用算法组合实现个性化推荐。3.4智慧旅游系统中网络数据流挖掘智慧旅游系统的数据是流动的,是由旅游特点决定的。预测复杂网络中信息传播过程的方法主要是结合信息流信息进行挖掘。由于复杂网络的性质,在数据挖掘过程中,我们更感兴趣的是数据的动态属性,即信息流的属性。数据流挖掘意味着您可以在真正需要时使用任何数据。当发现有数据流来时,需要及时处理数据。否则,数据将丢失。智慧旅游系统通过云计算、物联网等技术手段,及时捕捉所有信息流,进行精准数据分析,提取有用样本,向智慧旅游系统控制中心提供指挥信息。一般来说,流处理的常用方法是选择或过滤。换句话说,您希望流只接受一组满足特定条件的元组。允许的元组被流式传输到其他进程,而其他元组被忽略。在复杂的网络中,智慧旅游处理的信息不仅包括结构信息,还包括属性信息和信息流,因此不仅需要研究静态属性,还需要研究动态属性。传统的网络挖掘方法甚至无法描述或预测复杂网络中信息分布的动态过程。在构建智慧旅游系统时,将复杂网络的数据挖掘系统应用于数据处理。通过构建可靠、可靠、高效的数据挖掘机制,可以预测数据流处理中信息传播过程中的问题。整个智慧旅游是一个以旅游为导向的人流系统。

第四章大数据挖掘在智慧旅游中的展望数据挖掘技术对现代信息数据管理和信息化发展均具有重要意义,而且已经对许多行业的发展产生了重要影响。在旅游行业中,随着线上旅游服务的发展,信息化的旅游服务将逐渐成为一种发展趋势,数据挖掘技术将对旅游信息化服务产生更加重要的影响,其中对于旅游服务平台或是旅游软件的旅游路线管理具有重要作用。一方面,利用旅游路线管理系统,旅游服务平台可以通过进一步调整旅游路线,提升路线的吸引力,保持住热门路线的市场竞争力,及时调整冷门路线,降低游客的流失率。另一方面,可以通过完善旅游服务平台的旅游路线管理,来提升旅游服务软件的市场价值,进而提高旅游服务软件的市场竞争力。国内外对于数据挖掘技术及其应用有了较为具体的研究,对旅游服务软件的路线管理方面的研究相对较少,此外,数据挖掘在旅游服务软件路线管理中的应用研究较少,因此基于数据挖掘的智慧旅游路线管理具有广阔的研究空间。(1)基于数据挖掘的智慧旅游路线系统开发。当前智慧旅游的整个系统软件实际上仍较为简单,使用数据挖掘,能有效提升旅游路线的分类以及信息筛选,因此数据挖掘的智慧旅游路线管理系统的开发设计将是未来研究的一大方向。(2)智慧旅游路线管理模块的运行。基于数据挖掘的智慧旅游路线管理系统实际上更为便捷,但是当前的旅游服务软件中的路线管理系统是否具备了完善的运行模块以及各运行模块如何更好的进行磨合和发展,则是影响智慧旅游路线管理良性发展的关键因素。

结论近年来,随着时代经济的飞速发展和科技的飞速发展,旅游业逐渐积极发展,逐渐引领时代发展潮流。同时,大数据时代的到来也是当今媒体的热门话题之一。旅游大数据在旅游业中的应用一直是旅游业研究的重点之一。本文在研究旅游大数据及其在挖掘和旅游行业中的应用的同时,首先对大数据和旅游数据挖掘进行了概述,分析了旅游大数据和挖掘在旅游行业中的必要性。最后对旅游大数据与挖掘在旅游行业的应用方向进行了探讨和总结。随着时代经济的高速发展,旅游大数据和挖掘技术也在蓬勃发展,当前旅游市场的竞争也越来越激烈,为了让旅游企业有更好的市场发展前景,现代旅游企业必须提高旅游大数据的信息处理能力,进行有效的信息挖掘,获取有价值的信息,争取更多的市场发展机会,合理配置旅游资源相关系统,不断寻找和组合潜在客户。根据潜在客户的需求,提供定制化的旅游服务,全面促进旅游业的快速发展。

参考文献[1]高歌.大大数据应用对河北省旅游业发展的影响及促进研究[D].河北大学,2021.[2]刘小嵌.移动互联网背景下年轻旅游者旅游消费决策影响因素研究[D].湖南师范大学,2017.[3]赵鹏.大学生旅游消费行为影响因素研究[D].中南大学,2012.[4]郑海青.基于大数据挖掘的个性化旅游推荐研究[D].武汉大学,2017.[5]姜腾.大数据挖掘技术应用于职业教育信息系统研究[J].办公自动化,2019,24(03):59-63.[6]于雪萌基于学生行为分析的教育大数据挖掘算法研究[D]山东师范大学,2020.[7]张曾莲著.基于非营利性、大数据挖掘和科学管理的高校财务分析、评价与管理研究:首都经济贸易大学出版社,2014.05[8]杨学兵,张俊.决策树算法及其核心技术[J].计算机技术与发展,2007(01):43-45.[9]鞠静.基于决策树算法的高校图书馆图书采访决策模型研究[D].河北大学,2021.[10]杨小娟决策树算法在学生课程成绩分析中的应用研究[D]云南师范大学,2021.[11]唐容.基于特征选择的CART算法研究[D].电子科技大学,22.[12]刘亚芬.基于GA的CART决策树改进算法与应用[D].广州大学,22.[13]李如平.大数据挖掘中决策树分类算法的研究[J].东华理工大学学报(自然科学版),2010,33(02):192-196.[14]ImprovingrandomforestalgorithmbyLassomethod[J].JournalofStatisticalComputationandSimulation,2021,91(2).[15]ZhonghuiTan,JuanHuo,ShuoMa,DingHan,XinWang,ShensenHu,WeiYan.EstimatingcloudbaseheightfromHimawari-8basedonarandomforestalgorithm[J].International

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论