基于Python的电影票房信息数据的爬取及分析_第1页
基于Python的电影票房信息数据的爬取及分析_第2页
基于Python的电影票房信息数据的爬取及分析_第3页
基于Python的电影票房信息数据的爬取及分析_第4页
基于Python的电影票房信息数据的爬取及分析_第5页
已阅读5页,还剩50页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

广东东软学院本科毕业设计(论文)摘要现如今,人民群众对物质生活水平的要求已不再局限于衣食住行,对于精神文化有了更多的需求。电影在我国越来越受欢迎,电影业的发展越来越迅猛,为了充分利用互联网技术的发展,掌握电影业的态势,对信息进行挖掘和处理、提高数据库的利用率,本文采用文献分析法,对网络爬虫的相关内容以及发展现状进行简单介绍,并利用网页抓取技术爬取电影票房网站的相关数据,进行分析,为票房分析提供数据支撑。关键词:Python网络爬虫电影票房AbstractNowadays,thepeople'srequirementsformateriallivingstandardsarenolongerlimitedtoclothing,food,housingandtransportation,andthereismoredemandforspiritualculture.MoviesarebecomingmoreandmoreFashionableinChina,andthemovieindustryisgrowingrapidly.InordertomakefulluseofthedevelopmentofInternettechnology,graspthesituationofthemovieindustry,mineandprocessinformation,andimprovetheutilizationrateofthedatabase,Thispaperintroducesthecontentanddevelopmentofwebcrawlerbyliteratureanalysis,andusewebpagecrawlingtechnologytocrawlandanalyzetheboxofficedatarelatedtomoviewebsites,whichprovidespowerfuldatasupportforboxofficeanalysis.Keywords:Pythonwebcrawlermovieboxoffice目录TOC\o"1-2"\h\u28089摘要 125982Abstract 116422一、绪论 3310311.1研究背景 4103971.2研究现状 4112781.3研究方法 418560二、系统开发工具与相关技术 5112082.1Python网络爬虫 5182122.2系统开发工具 52.2.1pycharm工具 52.2.2MySQL数据库 52.2.3HbuilderX工具 6299882.3系统后台技术 6134202.4系统前端技术 614217三、系统分析 8312473.1系统功能分析 8263173.2系统功能性需求分析 103.2.1系统用户功能性需求分析 103.2.2系统管理员功能性需求分析 12263173.3数据获取 14263173.4数据分析 13263173.5数据展示 1319986四、系统设计 15287874.1文件结构图 15287874.1.1前端demo文件结构图 15287874.1.2后端爬虫系统文件结构图 1578594.2前端功能模块 164.3登录与注册模块设计7859 164.4数据库表设计7859 174.5数据展示模块设计7859 18五、系统实现7859 205.1解决网站反爬机制7859 205.2实现网络爬虫7859 235.2.1找出url变化规则并获取链接7859 265.2.2解析并获取网页数据7859 265.2.3将数据存储至数据库7859 275.3登录注册模块实现7859 285.4数据展示模块实现7859 2814842六、票房网站信息数据爬取结果及分析 326.1以2019年的票房榜单Top20为例分析7859 326.2结果分析7859 321131七、结论与建议 367.1结果分析7859 367.2不足点7859 367.3对未来的展望7859 3726500参考文献 3815322致谢 39

绪论1.1研究背景近几年,在网络Python语言强势的发展背景下,数据思维及数据分析方法也逐渐被运用到各个领域当中,成为人们进行分析数据,传播内在规律的有效途径。要是我们只借助人力下载有关信息,不仅需要花费很多时间,而且得到的消息也非常少。网络爬虫是个可以自己获取网页的次序,它会在拥有大量信息的信息库里十分有效率地提取有用的信息,这就让解决和剖析数据变成了现实。网络爬虫会持续提取网页上的数据储存进本地,通过剖析和筛选,在缓存完成的数据中创建好指引并且把它们储存到体系里,可以协助之后要用的人更方便地查询以及搜索。爬虫系统很好的提取出藏匿在众多数据后的信息十分有效率地搜索,在很大程度上更好地运用了信息数据库。爬虫系统节约了很多人力阅读以及储存数据信息的时间,协助研究人员以及储存众多信息,因此可以更加便捷地获取藏匿在数据之后的知识。中国的爬虫技能探究虽然开始研发时期比国外晚,但是发展的势头十分迅猛,成果显著。对爬虫技术的研究可以追溯到2003年,一些以数据探索为主题的学界研讨会渐渐在中国传播开来。从此之后,国内的研究人员开始慢慢涉足爬虫领域,并逐渐深入。直到2007年,一名研究人员在爬虫领域取得了新的突破。他就是浙大的罗兵教授。他的研究基于对古版互联网爬虫技能的精通,对剖析领域与支撑领域分别深入调研,使下载内容的分解过程得以完善。在此基础上,越来越多的学者在爬虫领域取得了新的突破。他们已经可以获取流动的互联网信息,提高了爬虫领域的使用效能。与此同时,也减轻了使用户进行下载的压力。让下载的工作更加高效便捷。因此,更新换代之后的爬虫工具已经成为人们工作时用来信息查找,信息整理,数据分析的一大利器。爬虫工具的使用与发展不仅仅推动了爬虫技术的探究与发展,还十分有利于专家学者研究反爬虫技术。而电影行业的发展越来越快,越来越深入。电影行业的不断发光发热也引起了大量企业和国家统计部门的广泛关注。大数据的新基建的建设同时也加快了电影行业的发展,但是目前关于电影数据的采集和挖掘的技术方案还是不够完善。本文基于网络爬虫理论,开展电影票房相关数据的采集挖掘和分析,而如何从猫眼电影票房网站相爬取需要的数据,是本次项目的核心所在。本文通过python编写爬虫脚本以实现获取票房数据的方案,并找出猫眼电影网的反爬机制,根据相关的反爬机制进行破解。最后把爬取到的数据以图表的形式进行分析介绍。1.2研究现状网络爬虫在消息探索与数值整理进程中发挥着关键作用,上世纪初,就已有科学家对爬虫开启探究模式,现今,爬虫技能已处于成熟阶段。网络爬虫可主动获取网络界面,从而自行下载主人所需要的东西,基本实现了大幅度的数据下载模式,也更便于人们利用其进行高效工作。在我国,爬虫技能发展的有关探究开启速度比较慢,但其后续的发展却非常迅猛。2003年该技能得到正式发展,国内数据探索的学论会越来越常态化,在该区域中的探究也随之扩展。2007年,浙大教授罗兵在旧版网络爬虫的基准上,增添了分析模型,使对该内容的分析越发完善。近几年,经过我国学界的专家、学者们的积极探讨与破除障碍,使得我国流动性网络消息的获得能力不断提升,爬虫体系的效能也随之增强。既减弱了人工完成的压迫感,也逐步实现了高效率的下载任务,成为了大众查找、分解与融合信息中不可或缺的手段。1.3研究方法①著作了解法②撰写程序语言:Python语言、HTML语言、JS语言、css语言③信息库技能:MySQL信息库技能

二、系统开发工具与相关技术本章节主要表述该课题所开发的猫眼电影票房数据爬取系统开发所用到的工具及相关技术,还有技术介绍。2.1Python网络爬虫Python语言是一种开源编程的语言,其强大的功能、简洁易懂的语法、系统兼容性广以及学习上手成本低的优势受到许多开发者的青睐。Python具有高效率且简单地实现面向对象编程的优势。对于数据库也能直接方便的进行操作,在处理一些规模较大的数据分析上具有很高的效率。而网络爬虫,简言之,就是进行网页爬取,模拟普通用户去浏览网页却实际在爬取数据的过程。综合来说,python网络爬虫就是利用python这个程序语言来编写爬虫程序或者脚本。基于python的网络爬虫程序开发分为三个步骤:首先,做充分调研确立爬虫对象,然后深入调查该网站的反爬虫机制,然后编写爬虫程序并开展爬虫工作获取数据。将获取的数据经过清洗过滤,以png、excel、mp4等文件类型或者保存着数据库等方式,保存爬取的数据。常见的网络爬虫有两种,分别是广度优先爬虫和聚焦爬虫。其中广度优先爬虫主要适用一般网络搜索引擎的网络爬虫对象,类似百度、谷歌以及搜狗搜索之类的搜索引擎,采用的网络爬虫主要是广度优先爬虫技术。而聚焦爬虫主要适用于垂直搜索引擎的网络爬虫对象。类似需要搜索某一领域的内容。本课题所采用的的也是这一类型的聚焦爬虫技术。综上可知,若想依据使用者自身的意见来获取目的网络界面的内容,满足自身的要求,最佳的办法便是以自身需要为主来编写爬虫次序。此探究驻足于猫眼电影网页的体系分解,对爬虫进程中会碰到的各种难题,以Python语言为基准撰写了对猫眼电影网电影信息数据获得的互联网爬虫程序。2.2系统开发工具2.2.1.pycharm工具PyCharm是一款高效简洁的Python开发工具,代码分析能力强,用户在打代码的过程中可以快速补全pycharm所建议的代码,而且自带了多项编辑器。功能十分强大。2.2.2MySQL数据库MySQL数据库是一款强大的数据库,体积占比不大、学习成本低且系统兼容性十分优秀。在使用上方便易懂。2.2.3.HbuilderX工具Hbuilder是一款HTML的编辑器,同时也结合了IDE。从外观上看,该工具界面清爽,而且性能敏捷使用起来很轻巧。

2.3系统后台技术1.flask-web框架技术Flask是一个的基于python的web框架。2.requests库requests库基于urllib,在本系统里,requests库主要功能是请求目标网站、各种请求方法等方式。3.Beatifulsoup库BeautifulSoup一种解析器,是借助于Python进行开发的。该解析器将不规则标签进行整理,并且进一步建立分析树。Beautifulsoup组件的功能相当强大,其主要功是能够检索当前页的内容,按照需要选取有用的部分,且输出时能够自动校对格式。4.Numpy库Numpy库主要用于数组运算,在本系统中,破解猫眼电影字体反爬里有用到该库来计算欧氏距离配对字体。5.lxml库lxml库是一款解析器,在解析网页内容中发挥着不可或缺的角色。2.4系统前端技术1.layui框架技术layui是一款前端UI框架,高度模块化的独特设计,使其上手学习成本大大降低。其中在本系统的演示部分,类似导航栏,主题选择等模块有涉及到layui技术。2.jQuery技术jQuery是一个JavaScript框架,接口的短小清晰、插件的丰富以及语法的独特性让使用者用起来十分的方便。而且该框架的兼容绝大多数浏览器,兼容性十分优秀。Echarts框架技术ECharts是一款前端可视化框架,使用者可以使用该框架搭建自己所需要的图表,因为Echarts提供了许多生动美观的图表供使用者使用。其中在系统的演示部分,类似折线图、词云图、柱状图等数据图表都用到了ECharts技术。

系统分析3.1系统功能分析本电影信息数据爬取系统主要由后台管理模块和用户模块两大模块组成,其中用户模块的适用对象为普通用户,主要功能包括了登录注册、主题设置、个人中心、可视化展示以及信息推送功能。其中除了登录注册功能之外,其他功能需要再用户登录的情况下才能使用。接着是后台管理模块,其适用对象主要为管理者。后台管理模块的主要功能为:数据爬取、用户管理、页面管理以及数据管理。其管理权限较大。具体功能模块示意图如3-1所示。其中,管理员功能用例图对应图3-3,用户功能用例图对应图3-2图3-1系统功能模块示意图图3-2用户功能用例图图3-3管理员功能用例图3.2系统功能性需求分析本节从用户功能和管理员这两个模块分别阐述其功能性需求和做详细的分析介绍。通过详细的分析介绍进一步明确系统功能性需求,为接下来的系统设计与开发做好布置工作。3.2.1系统用户功能性需求分析图3-4用户功能需求概述图图3-4为猫眼电影票房信息数据爬取系统的用户功能需求的概述图,下面将对图3-4所列的功能进行详细的讲解和说明。用户登录功能用户登录功能为该系统的基础功能,用户进入该系统的前提是登录账号,登录账号之后可以进入系统,并且系统会开放所有功能供用户使用。用户在未登录账号的情况下,无法进入该系统。用户注册功能用户注册功能的作用是让用户在未拥有账号的状态下可以进行注册,获得账号,以得到更多的功能。页面基本操作功能页面基本操作功能是该系统的基础功能,该功能具有四个子功能,分别为页面刷新功能、页面全屏功能、页面主题设置功能以及信息推送内容。以下对其四个子功能进行详细的讲解和说明。页面刷新功能:该功能为页面基础功能的子功能之一,主要是给系统页面进行刷新,将系统页面置于初始状态。页面全屏功能:该功能为页面基础功能的子功能之一,主要是将系统页面放至全屏状态,方便用户更详细的查看页面。页面主题设置功能:该功能为页面基础功能的子功能之一,主要是将系统页面的主题颜色、按钮进行更改,方便用户根据自己的喜好对系统页面主题进行DIY设置。信息推送功能:该功能为页面基础功能的子功能之一,主要是查看和预览用户的个人推送信息。数据可视化操作功能数据可视化操作功能为该系统的重要功能,该功能具有五个子功能,分别为浏览电影票房变化功能、浏览电影数据概括功能、浏览电影票房榜单功能、浏览电影演员劳模功能以及浏览电影票房占比功能。以下将其五个子功能进行详细的讲解和说明。浏览电影数据概括功能:该功能为数据可视化操作功能的子功能之一,主要是对全部电影信息数据进行概括,将其基本信息以表格形式展示出来,方便用户浏览查看。浏览电影票房占比功能:该功能为数据可视化操作功能的子功能之一,主要是对各个电影类型票房占比情况分别以柱状图和玫瑰图的形式展示出来,用户可以选择不同的年份和月份查看不同时期时的各个电影类型票房占比情况。浏览电影票房榜单功能,该功能为数据可视化操作功能的子功能之一,主要是将电影票房靠前的电影名字以词云图的形式展示出来,用户可以选择不同的年份和排行数量,查看不同时期时电影票房排行靠前的电影名字。票房越高的电影,其名称字号大小将会更大。方便用户对电影票房查看,一目了然。浏览电影票房变化功能,该功能为数据可视化操作功能的子功能之一,主要是将2015年至2019年的电影票房走势以折线图的形式展示出来,用户可以选择不同的电影类型查看该电影类型的票房走势情况。浏览电影演员劳模功能,该功能为数据可视化操作功能的子功能之一,主要是将电影演员参演次数情况以词云图和柱状图的形式展示出来,用户可以选择不同的年份和排行数量,查看不同时期时电影演员参演次数靠前的演员名字。参演次数越多的演员,在词云图里,其名字的字号大小将会更大,在柱状图里,将会更明显。用户个人信息修改功能用户个人信息修改功能为该系统的基础功能,该功能具有三个子功能,分别为用户更新基本信息功能、用户账号绑定功能以及用户修改密码功能。以下将其三个子功能进行详细的讲解和说明。用户更新基本信息功能,该功能为用户个人信息修改功能的子功能之一,用户在该功能上可以更改自己的邮箱、昵称、个人简介、街道地址以及联系电话信息。用户账号绑定功能,该功能为用户个人信息修改功能的子功能之一,用户可以在该功能上可以修改密保手机、密保邮箱、绑定QQ以及绑定微信。用户修改密码功能,该功能为用户个人信息修改功能的子功能之一,用户可以在该功能上修改自己的账号密码。3.2.2系统管理员功能性需求分析图3-5管理员功能需求概述图图3-5为猫眼电影票房信息数据爬取系统的管理员功能需求的概述图,下面将对图3-5所列的功能进行详细的讲解和说明。修改用户账号信息功能修改用户账号信息功能可以更改用户的账号和密码,管理员可以根据需求,将用户的账号或者密码进行更改电影数据爬取功能电影数据爬取功能,该功能是整套系统的核心。该功能具有两个子模块,分别为爬取猫眼电影信息数据功能和破解猫眼电影网反爬机制功能。以下就其两个子功能进行详细的讲解和说明。爬取猫眼电影信息数据功能,该功能为电影数据爬取功能的子功能之一。管理员可以将猫眼电影网所需的信息数据获取下来,为其他功能使用。破解猫眼电影网反爬机制功能,该功能为电影数据爬取功能的子功能之一。利用该功能可以破解猫眼电影网的部分反爬机制,类似数字乱码这方面的技术难题。对管理员来说十分有用。系统模块管理功能系统模块管理功能,该功能是整套系统实现可视化的关键。该功能具有四个子功能,下面分别阐述这四个子功能的内容:新增系统模块功能,该功能为系统模块管理功能的子功能之一。管理员可用该功能新增所需的系统模块。删除系统模块功能,该功能为系统模块管理功能的子功能之一。管理员可用该功能删除所需的系统模块。更改系统模块功能,该功能为系统模块管理功能的子功能之一。管理员可用该功能更改所需的系统模块。查询系统模块功能,该功能为系统模块管理功能的子功能之一。管理员可用该功能查询所需的系统模块。电影信息数据管理功能电影信息数据管理功能,该功能具有四个子功能,分别为新增电影信息数据功能、删除电影信息数据功能、更改电影信息数据功能以及查询电影信息数据功能新增电影信息数据功能,该功能为电影信息数据管理功能的子功能之一,管理员可以用该功能新增电影信息数据,以此来更新系统。删除电影信息数据功能,该功能为电影信息数据管理功能的子功能之一,管理员可以用该功能删除电影信息数据,以此来清洗过滤不需要的信息数据。更改电影信息数据功能,该功能为电影信息数据管理功能的子功能之一,管理员可以用该功能更改电影信息数据,纠正格式不规范或者错误的电影信息数据。查询电影信息数据功能,该功能为电影信息数据管理功能的子功能之一,管理员可以用该功能查询电影信息数据,以此来查找到所需的电影信息数据。

3.3数据获取系统数据分析里,必不可少的一环是数据获取。因为系统的数据分析是基于数据来展开的。数据获取之前要明确什么数据是需要用到的,什么是不需要的。经过筛选之后确定数据目标,进而在获取数据。根据本次课题,需要获取的信息主要是通过Python爬取筛选2015年至2019年之间的评分靠前电影数据,例如电影名、评分、票房以及上映时间等内容。3.4数据分析在确定获取数据的目标及得到了数据之后,进一步做的是分析数据。本系统主要是通过统计分析的分析方式去研究某个时间段的票房变化及演员的参演次数,来完备该系统。3.5数据展示数据展示原理是将数据进行可视化,让用户方便清晰地了解到该系统数据的变化。此系统的数据可视化图表主要是以五种形式存在,分别是:表格、词云图、折线图、柱状图和玫瑰图来分析结果。其中数据概述的结果使用表格形式显示,票房占比的结果使用柱状图和玫瑰图形式显示,票房榜单的结果使用词云图形式显示,票房变化的结果使用折线图形式显示,演员劳模的结果使用词云图和柱状图形式显示。

系统设计系统详细设计阐述了该系统如何实现的一些较为重要的功能,该章节利用图文结合的方式,让表述更加清晰,更加方便读者了解到本系统的具体构造。4.1文件结构图4.1.1前端demo文件结构图图4-1前端demo文件结构图1.assets文件夹是本系统的资源目录,包括js,css图片,依赖的库文件都在里面。2.page文件夹为主页面目录,各个模块的页面,需要localhost运行起来才能打开。3.index.html为根文件,里面存放了前端的主体代码,采用前端框架是layui+jQuery+echarts。4.1.2后端爬虫系统文件结构图图4-2后端爬虫系统文件结构图关于爬取网站的信息有这5个文件:creat_db.py文件,主要功能是创建数据库。demo.py文件,主要功能是调用数据到前端,实现前后端的数据交互。font.py文件,主要功能是字体反爬破解。get_data.py文件,主要功能是爬取猫眼电影网站数据。font文件夹,主要功能是字体配对。4.2前端功能模块系统的展示层最主要的页面和相关解释如下:console.html:控制台页面,用于展示。bangdan.html:票房榜单页面,用于分析不同的时期里,电影的票房排行。bianhua.html:票房变化页面,用于分析不同电影类型在2015年至2019年的票房走势。data.html:数据概括页面,用于展示爬取的电影数据内容。laomo.html:演员劳模页面,用于分析不同时期里,演员的参演次数排名。piaofang.html:票房占比页面,用于分析不同时期里,各个电影类型的票房。login.html:用户登录注册页,用于用户的登录与注册。user-info.html:用户信息页面,用于用户修改自己的信息。tpl-message.html:信息通知面板页面,用于信息通知。tpl-password.html:用户密码修改页面,用于用户修改自己想要密码。tpl-theme.html:主题修改页面,用于用户修改系统页面的主题、标签,按钮等操作。index.html:首页,用于展示和操作相关可视化界面。以上html页面主要采用了layui+jQuery搭建主体框架,其中可视化数据图表采用的是Echarts图表库,对数据挖掘和整合非常友好。4.3登录与注册登录和注册页面是用户进行登录和注册的地方,在登录页面中用户能够输入账号和密码进行登录,倘若用户是第一次访问并没有账号,可以点击注册按钮进行账号注册。图4-3登录流程图4.4数据库表设计通过利用Python抓取电影票房数据内容,进行有效的清洗、转换等操作之后保存下来。接着做数据表设计。包括表中的字段名称、数据类型、数据长度、是否为主键,字段说明等。如表4-2所示:表4-2电影films表字段名称数据类型长度是否为主键字段说明namevarchar255是电影名称timevarchar255否电影上映时间type1varchar255否电影的类型type2varchar255否电影的类型type3varchar255否电影的类型type4varchar255否电影的类型type5varchar255否电影的类型countryvarchar255否电影出品国家lengthvarchar255否电影长度yearint0否上映时间(年份)monthint0否上映时间(月份)dayint0否上映时间(日期)directorvarchar255否导演actor1varchar255否演员actor2varchar255否演员actor3varchar255否演员actor4varchar255否演员scorevarchar255否电影分数peopleint0否评分人数box_officebigint0否电影票房typevarchar255否电影类型总和该系统数据库主要是films表,films表中储存的是爬虫程序在猫眼电影网站上爬到的所有电影数据,其中的字段包括了`name`,`time`,`type1`,`type2`,`type3`,`type4`,`type5`,`country`,`length`,`year`,`month`,`day`,`director`,`actor1`,`actor2`,`actor3`,`actor4`,`score`,`people`,`box_office`,`type,name字段表示电影名称、time字段表示电影上映时间、type1-5表示电影的类型、country表示电影出品国家、length表示电影长度、year、month、day表示上映时间、score表示分数、actor表示演员、director表示导演、people表示评分人数、box_office表示票房。type表示电影类型总和。图4-4为数据库的实体关系E-R图,主要作用是清晰地展示出系该统中各实体之间的关系。图4-4数据库E-R模型图4.5数据展示模块设计本系统的功能模块以猫眼电影信息数据为主,通过构建多种多样的图表模型向用户展示爬取到的票房数据,即直观又方便。同时了方便了非专业人员对该系统的理解及使用。该系统将从五个模块对从猫眼电影网爬取回来的电影数据进行分析,分别是数据概述、票房占比、票房榜单、票房变化,演员劳模五个模块作研究分析。模块示意图如4-5所示:图4-5数据展示模块图(1)票房占比模块:使用柱状图展现表达出猫眼好评靠前电影中哪个类型的电影在猫眼电影网的票房最高。可以理解为哪个类型的电影更受观众的青睐。使用玫瑰图展现表达出猫眼好评靠前电影中哪个类型的电影占最大的比例。票房榜单模块:使用词云图将猫眼好评靠前电影清单中,将票房突出的电影名字放大处理。字号越大更能凸显哪部电影的票房更高,更受观众的欢迎。(3)数据概述模块使用表格形式将电影的基本信息展示出来,类似电影名字、电影出品国际、票房、评分及评分人数等内容。电影的基本一目了然(4)票房变化模块:使用折线图展现表达出猫眼好评靠前电影中哪个类型的电影,在2015年至2019年这段时间票房的走势。通过选择不同的电影类型,直观的看到该类型电影的票房走势。演员劳模模块:使用用词云图将猫眼好评靠前电影清单中,将演员参演次数突出的演员名字放大处理。字号越大更能凸显哪位演员参演次数更多,在电影行业里更加投入。使用柱状图展现比较出猫眼好评靠前电影中演员参演次数的高低。

系统实现5.1解决网站反爬机制爬取猫眼电影网站的电影详情数据,首先是要解决网站的反爬机制,然后获得权限访问网站数据。否则爬取工作无法进行。所以爬取数据要绕过网站的反爬机制,通过研究该网站发现了有以下三个机制:反爬机制一:申请向猫眼电影网服务器发送访问请求时,该服务器会判断是否为用户浏览器发来的请求,这其中会有个判断识别。那么爬虫就需要绕过该识别。于是我们需要在Python里添加头部信息文件headers。用这个headers来绕过服务器的判断识别。图5-1添加headers请求头反爬机制二:使用python进行爬虫的时候,猫眼电影网站会检测到我们的访问请求过于频繁。这时候服务器就会阻止我们的访问。为了解决该困扰,在python里导入time方法。通过time.sleep()降低访问请求频率。模拟打开页面以查看页面的真实用户的操作,避免被猫眼电影网站阻止或拒绝。图5-2time.sleep()函数(3)反爬机制三:使用python进行爬虫的时候,是个自动化采集数据的过程,如果采集的方式不当,采集频率高或者数量多了,猫眼电影网的反爬机制就会监测到我们正在使用程序爬取数据,这时候会出现一个滑动验证码。不滑动该验证码,爬取任务就无法继续进行。但破解滑动验证码的反爬机制是个比较大的挑战。到目前为止,笔者的操作方式是人工手动滑动图片。图5-3猫眼电影滑动验证码(4)反爬机制四:在猫眼电影详情页使用谷歌浏览器开发人员工具发现,猫眼电影网会有独特的文字反爬机制。致使我们没法在开发人员工具里直接获取准确的数字。而且每次刷新页面,猫眼电影网页源代码里的文字下载链接每都会随之改变。这时候为了获取准确的数字,就需要找出字体规则然后做进一步的判断,得到精准数字。下面是动态字体反爬破解处理过程:一、网页分析首先尝试对猫眼电影详情页的信息进行获取。图5-4开发工具检查猫眼电影详情页通过谷歌浏览器开发人员工具发现,猫眼电影网采用了文字反爬处理,导致我们在开发人员工具里看到的数据是框框,也就是所谓的乱码。图5-5查看猫眼电影网页源码用谷歌浏览器查看网页源码并刷新页面,发现图5-5三处编码会随之改变。图5-6获取猫眼电影网页源代码的文字编码的url于是搜索关键字(stonefont),找到图5-6里的三个url地址,将最后一个地址的字体文件下载下来(woff格式)二、处理字体使用FontCreator工具打开下载的字体文件(maoyan.woff)图5-7maoyan.woff字体对应的编码通过图5-7我们将每个数字的编码,输入至Python里,构成字典。(下面是笔者下载的字体文件对应的编码)图5-8下载的字体文件对应的编码接着刷新页面,获取并下载新的字体文件。然后将新的字体文件保存为xml文件。图5-9woff文件转xml格式代码接着打开xml文件(图5-10)可以发现图5-10xml文件编码对象这里的id对应的数字并不是准确的。并且前两个编码是无用的,处理时需要去掉该两个编码。图5-11单个字体的轮廓描写坐标图5-11为字体的轮廓描写,只要将这些坐标进行绘制,就能得到需要的字体。用FontCreator工具打开两个字体文件,Python打开两个字体文件的xml。对同个数字分别将编码和坐标进行对照。我们会发现两个字体之间的坐标没法一一对应。所以在接下来的工作里,不能用坐标对照法来对应字体对象。三、编码映射图5-12字体对比用FontCreator软件打开两个woff字体文件,仔细看图5-12会发现字体之间存在着明显的差异,倘若字体比较小时,很难看出不一样的地方。所以两个字体的字形或者轮廓是否接近,成为了我们判定两个字体相似的关键所在。坐标越接近,字形越相似。自然而然,欧氏距离算法成为该问题的解决的关键所在。接下来展示欧氏距离算法的使用过程。图5-13为欧式距离算法公式。图5-13欧氏距离算法公式图5-14欧氏距离算法四、处理逻辑1.首先下载字体文件(base)作为对比文件,接着通过FontCreator工具找到base字体编码,然后用python手写unicode与数字对应的字典,使用Python的fontTools库提取base中的编码列表和字体坐标列表。2.用谷歌浏览器查看网页网页源代码,找到新的字体文件(new)的下载地址,下载下来。使用Python的fontTools库提取字体文件(new)的编码列表和字体坐标列表。3.采用欧式距离算法将字体文件(new)的编码和字体文件(base)的编码进行计算,算出其中最小的欧氏距离编码。4.最后将手写的编码字典比对算出的最小的欧氏距离编码,于是就能找到我们想要的字体。。四、字体处理效果展示字体处理效果如图5-15图5-15字体处理效果5.2实现网络爬虫5.2.1找出url变化规则,获取url链接主要的反爬虫机制处理完后,接下来需要将猫眼服务器返回的数据进行获取和解析,让这些数据通过我们想要的文件类型保存下来。打开浏览器的开发者工具可以看到猫眼电影网的request请求是GET。爬取GET请求方式的网页通常来说比POST请求方式方便一些。首先,爬取电影网页数据时,我们需要获取电影详情页的链接。翻阅猫眼电影网的url记录下来,并观察其规则url='/films?showType=3&sortId=3&yearId='+str(k+14)+'&offset='+str(i)通过观察得出该url的规则后,会发现使用了循环传递参数k和i,每次k+14和不同的i传递到URL当中去,不断更新不同的访问链接。同时采用try-except异常处理语句,先尝试访问该链接,判断状态码(Status_Code)是否为200来判断该请求是否可爬取(图5-16)图5-16尝试访问该url5.2.2解析并获取网页数据采用BeautifulSoup库解析电影网页数据前,确保BeautifulSoup库是安装好的状态。输入相关代码检验是否安装。通过该库可以提取电影相关数据,类似电影名和评分人数。图5-17为解析网页数据源码,图5-18为其中一个网页源代码。图5-17解析猫眼电影网页数据图5-18猫眼电影网页部分源码5.2.3将数据存储至数据库如图5-20显示,从猫眼电影网页爬取到数据后,可以保存至本地、文件或者数据库里,本系统将数据结果写入至MySQL数据库当中(如图5-19)。后期如需编辑数据可用NavicatPremium12工具来修改。、图5-19信息写入MySQL数据库图5-20NavicatPremium12效果图5.3登录注册模块实现该模块是用户进入该可视化系统时进行登录或者注册的地方。用户进入系统时,会提醒用户进行登录或者注册的操作。用户可以在登录框输入自己的账号和密码进行登录。图5-21登录注册图5.4数据展示模块实现(1)数据概况模块数据概况通过表格的形式展示详细的票房信息,用户能够进行翻页查看票房数据,也可以跳转到具体某个页面。(图5-22)图5-22数据概括模块图(2)票房占比模块票房占比模块采用柱状图和玫瑰图的形式,用户通过选择年份及月份,可以看到该时期里,各个电影类型之间在总票房中所占的比例,能够直观的展示不同电影类型的票房之间的差异。(图5-23)图5-23票房占比模块图(3)票房榜单模块票房榜单采用词云统计的方式展示电影的票房高低,用户通过选择不同的年份和靠前数量,能够清晰的看到不同时期里突出靠前的电影,具有一定新颖性,容易吸引用户眼球。(图5-24)图5-24票房榜单模块图(4)票房变化模块票房变化模块采用折线图的形式,用户能够选择不同的电影类型,清晰的展示该类型的电影2015年至2019年之间的票房涨落信息,方便用户对电影的历史票房数据进行研究对比。(图5-25)图5-25票房变化模块图(6)演员劳模模块演员劳模模块采用词云图和柱状图的形式,用户通过选择年份和月份,可以清晰地看到不同时期里,演员的热度情况和参演次数。(图5-26)图5-26演员劳模模块图

票房网站信息数据爬取结果及分析经过一系列的爬虫工作,将有效的数据存储到数据库,最后再清洗加工将其可视化,直观地展示出数据的价值及意义。6.1以2019年的票房榜单Top20为例分析构建2019年票房榜单Top20词云图,其生成图如下图6-1所示:图6-12019年的票房榜单Top20词云图6.2结果分析以上图6-1的2019年的票房榜单Top20词云图为例,票房榜首的《哪吒之魔皇降世》在图6-1中十分突出明显,该影片在上映短短的时间内就突破了以往动漫电影的票房记录。《哪吒之魔皇降世》的成功,归功于该影片创作团队的努力。导演一人为了该部影片亲力亲为,甚至为了省钱,自学担任动画的动作指导。而参与制作这部影片的人数高达1600多人,突破了目前国产动画制作人数的记录,是国产动漫电影新的里程碑。同时这部电影传达的价值观念也深深的引起广大观众的共鸣。只要努力,即使与众不同也能找到自己的光辉。所谓那句“我命由我不由天”。下面以2015年至2019年之间电影票房为例,实现可视化。图6-2各电影类型票房占总电影票房的玫瑰图图6-2的玫瑰图是通过统计2015年至2019年里评分排行靠前的电影列表中,各部电影类型票房占全部电影票房的百分比。通过玫瑰图6-2可以看到票房排行前三的分别是:动作、冒险及喜剧。可见观众对于动作片的喜爱程度是十分之高的,更偏向于视觉上带来的享受。图6-3总票房排名前20的词云图图6-3的词云图是通过统计2015年至2019年里评分排行靠前的电影清单中,对总票房里排名前20的各部电影做视觉上的突出。图中清晰地看到《战狼2》这部电影的票房是最高的。《战狼2》这部电影的成功是多方面因素的结果,起决定作用的还是电影的质量,电影不论是在特效的处理上还是对剧情的把握,都不输好莱坞大片。同时该部电影军旅题材符合爱国主旋律,上映的时机恰逢建军90周年,观众对于民族文化的认同感在该部电影上得到了极大的共鸣。图6-42015年至2019年总票房走势折线图图6-4的折线图是通过统计2015年至2019年里评分排行靠前的电影清单中,电影总票房在这段时期里的走势。图中清晰地看到在2018年总票房达到顶峰,随之到了2019年出现下滑趋势。分析来看,2019年出现下滑原因主要有三个:1.许多热门的电影在2019年6月份的暑期阶段宣布了撤档,这对于原本期待影片上映的许多观众都没法到影院进行观看,影院票房的跌落十分明显。2.全国的银幕数量增速放缓。3.可能是热门头部电影的撤档,导致了影院观影的人数大幅度下降,再加上票房的上升,让许多观众望而止步。图6-5“演员劳模”词云图图6-5的词云图是通过统计2015年至2019年里评分排行靠前的电影清单中,各个演员参演次数在总演员参演次数里,出现频率最高的“演员劳模”。图中清晰地看到道恩·强森这位演员近年来参演次数是最高的。笔者认为,国内外电影最大的差别就是演员的努力程度,近几年参演次数最高的道恩·强森,即使是参演次数很高,但是一年的录制的影视也没有多于五部,在保证影片质量同时也如此“高产”,可见的其投入的精力之多和时间分配的合理。一部作品的好坏和演员对作品的投入程度是离不开的。演员的付出对得起来之不易的作品剧本,只有这样才可以观众带来更好的作品。

总结及对未来的展望7.1总结电影发展的越来越迅速,如何在这块红海市场中分得一杯羹成为一个比较具有挑战性的问题,因此本文基于python爬虫制作了一个爬取电影票房网站的爬虫程序,成功地爬取到了电影票房的数据并且保存到了数据库中并进行分析,通过这种操作,使得电影的票房更加透明,清晰。本文基于Python语言,对电影票房网站进行信息数据爬取和分析,通过利用Python抓取电影票房数据内容,数据从MYSQL数据库提取出来,进行有效的清洗,使用MySQL和pandas库等方式进行操作,使用web前端网页,让数据以柱状图、玫瑰图、折线图,以及词云图等方式展示在大众的眼前。以数据展示的结果,从而对某个时间段的电影票房的数据进行分析,进而了解大众专注热点趋势,进而分析了热点电影的基本情况。该系统利用了Python丰富的标准库以及快速开发的特长,其主要有这几个不错的优点:(1)该爬取系统对于使用Python程序比较陌生或者不熟悉的人来说也能很容易上手,只需要点击运行爬取程序里的get_data.py文件,爬取系统就会自动爬取数据,以完成复杂的爬取工作(2)采用相似度距离算法方式破解了猫眼电影网字体反爬,其亮点是方法新颖。(3)在Python程序里导入time方法,通过10秒的休眠时间,很大程度上降低了访问请求页面的频率。让服务器误以为是人为的操作,因此避免了被猫眼电影网站阻止或拒绝。(4)在爬虫程序里添加了头部信息headers文件,伪装给web服务器让其辨别为浏览器行为。方便后续的爬取工作正常进行。7.2不足点该系统在笔者看来还是有几点不足(1)该设计的主要缺陷是没有使用多线程,且没有破解滑动验证码的反爬机制,导致爬取效率不高,不适用于海量数据爬取,仍需进一步完善。(2)由于2020年疫情的影响,政府基本将所有娱乐场所的经营活动都暂停了,同时也包括了电影院。这对原计划春节档及春节档之后上映的影片公司来说,意味着这些影片需要全部断档及停播,对影片公司及行业而言是一次巨大的打击。由于2020年初上映的电影寥寥无几,所以在此次课题里2020年的电影票房没法统计到位。(3)该系统的用户功能模块部分还没有完全实现。(4)整套系统功能性不够丰富。该系统现阶段还是有很多可改进空间,例如在爬取系统的爬取效率,系统性能及架构上都可以进一步的优化以及完善。另外在当前疫情影响下,许多新的电影票房数据都有待爬取。因此希望有机会可以进一步地优化本系统,完善系统前后台的综合能力,让该系统的价值更加明显。7.2对未来的展望关于2020年的电影行业,在我看来,主要有三大困境困扰着中国的电影产业链难以支撑。困境其一是,由于疫情存在“人传人”的风险关系,在政府的明确要求下,线下的电影院纷纷被叫停。电影院对于电影来说,是一个必不可少的放映载体。对于观众来说更是一个让人感到身心愉悦的娱乐空间。影院的关闭意味着没有这两方面的资金入口,也就难以维持下去。困境其二是,原计划在2020年上映的电影由于疫情关系都没法上映,现在大多数拍摄好的电影都处于堆压状态。对于新电影的排片安排更是让许多影视公司来说是漫长无尽的等待。困境其三是,投资方逐渐撤离对电影行业的投资,剧组的资金没法到位,很多拍摄方面的技术、物资、人力资源需求都很难维持。致使拍摄数量寥寥无几。其中有份报纸的提到一项网络投票关于网友对去影院观看电影的看法,投票结果显示绝大多数的网友并无线下观看电影的消费需求,原因在于此次新冠状病毒的影响给大家树立了很强的卫生安全防控意识,对于群聚类的娱乐活动多多少少产生了一些抵触心理。更多的网友表示宁愿一个人在家里观看电影,也不愿意冒风险“小心翼翼”地去影院体验。笔者认为,电影院线行业规则或许将被打破,计划院线发行的影片将逐渐转向线上发行,传统所谓的窗口期将会被缩短。流媒体平台会大量参与,这对依靠票房收入为主要来源的线下院线会造成致命的打击。最终会对电影线上线下的格局带来新的变化。即使2020年电影行业很艰难,笔者也相信这坎也能跨过去。疫情期间见证太多感动的瞬间,中国人民团结的心一定会战胜疫情,电影行业也同样将会迎来春天。

参考文献[1]方芳.基于Scrapy框架京东网站笔记本电脑评论数据爬取和分析[J].电脑知识与技术,2020,16(06):7-9.[2]李玉香,王孟玉,涂宇晰.基于python的网络爬虫技术研究[J].信息技术与信息化,2019(12):143-145.[3]李福荣,贾志刚.基于Python的校园贴吧数据爬虫技术研究[J].技术与市场,2019,26(11):34-35.[4]成文莹,李秀敏.基于Python的电影数据爬取与数据可视化分析研究[J].电脑知识与技术,2019,15(31):8-10+12.[5]殷丽凤,张浩然.基于Python网上招聘信息的爬取和分析[J].电子设计工程,2019,27(20):22-26.[6]艾沛钰,闫丽.基于python的互联网数据爬取与解析的研究与实践[J].信息与电脑(理论版),2019,31(17):129-130.[7]王建,黄宁香.基于Python的微信公众号数据挖掘分析[J].电子世界,2019(11):17-18+21.[8]苗玥,刘晓勇,金佳妮,李可心.基于Python的医学数据爬取及分析处理[J].信息技术与信息化,2019(04):56-58.[9]郭向向,郑嘉慧,苗学芹.基于Python聚焦型网络爬虫的影评获取技术[J].时代金融,2019(11):71-72.[10]孟亚茹,姚凯学,安世博.基于Python的网络关键字热度获取工具的研究与实现[J].电子技术与软件工程,2018(17):181-182.[11]唐琳,何天宇.基于Python的自然语言数据处理系统的设计与实现[J].电子技术与软件工程,2018(16):160-162.[12]肖乐,丛天伟,严卫.基于python的Web大数据采集和数据分析[J].电脑知识与技术,2018,14(22):9-11.[13]刘熠.基于python的Web数据挖掘技术研究与实现[D].长江大学,2018.[14]方子菱,匡芳君.基于Python的网易民谣歌词数据分析[J].电脑与电信,2018(04):53-56.致谢我首先要感谢我的论文指导老师、广东东软学院的吴瑞然老师。吴老师对我论文的研究方向做出了指导性的意见和推荐,在论文撰写过程中及时对我遇到的困难和疑惑给予悉心指点,提出了许多有益的改善性意见,投入了超多的心血和精力。吴老师对我的帮忙和关怀表示诚挚的谢意!同时,还要感谢广东东软学院软件工程专业的授课老师们和所有同学们,大家在广东东软学院的项目管理学习中互相学习,互相帮忙,共同度过了一段完美难忘的时光。此外,还要感谢朋友以及同学们在论文编写中带给的大力支持和帮忙,给我带来极大的启发。也要感谢参考文献中的作者们,透过他们的研究文章,使我对研究课题有了很好的出发点。最后,谢谢论文评阅老师们的辛苦工作。衷心感谢我的家人、朋友,以及同学们,真是在他们的鼓励和支持下我才得以顺利完成此论文。

PowerPoint课件制作实用技巧PowerPoint是微软公司生产的制作幻灯片和简报的软件(以下简称PPT)。在我们许多人看来,它只不过是一个简单地对文字、图形、图片进行演示的软件,教学中的课件制作软件当属Authorware、Flash。Authorware和Flash制作的动画效果的确很好,而且它们的功能也很强大。不过这些软件在制作课件的过程中往往非常耗时,用这些专业软件来制作课件用于平时的教学往往效率很低。PPT就是一个非常简单、实用的制作课件的软件,只要你用好它,同样能做非常棒的课件来。一、掌握基本,知道“插入”。(一)知道从“插入”菜单进入,会给PPT课件添加文字、图片、影片和声音等,也就会做一般的课件了。(二)图片插入与处理1.插入图片具体方法:a)插入剪贴画或文件中的图片;b)添加图片做背景;c)给自选图形做填充。2.处理图片具体方法:我们用PPT制作课件时,经常从网上下载图片来用,而网络中的图片往往含有超链接和网站名称痕迹,我们需要删除其中超链接,并对图片进行裁剪处理。在Powerpoint中,我们一般可以利用“图片”工具栏上的“裁剪”工具进行裁剪处理,但是,这里的工具只能对图片进行矩形裁剪,若想裁剪成圆形、多边形等其他形状,通常方法就无能为力了。其实这个问题在PPT中是可以解决的。我们用给自选图形做填充图片的方法就可以实现我们需要的效果。具体步骤:a)首先利用“绘图”工具栏画一个想要裁剪的图形,如椭圆。b)选中椭圆后单击“绘图”工具栏上“填充颜色”按钮右侧黑三角,从列表菜单中单击“填充效果”命令。c)打开选择“图片”选项卡,单击〔选择图片〕按钮,从“选择图片”对话框中找到合适的图片,单击〔插入〕按钮后返回到“填充效果”对话框最后单击〔确定〕按钮后退出。此图片当作椭圆图形的背景出现,改变了原来的矩形形状,获得了满意的裁剪图片效果。图片在插入PPT之前,我们可以用ACDSEE软件进行加工,如改变大小,裁剪等操作。二、学会下载,查找方法。在制作课件过程中,我们时常需要从网络上下载各种资源用以丰富课件内容,提升课堂效果。但有许多网站的flash动画都不提供下载;还有网站为我们提供了许多视频素材,这些视频素材都是FLV流媒体格式。FLV流媒体格式是一种新的视频格式,全称为FlashVideo。由于它形成的文件极小、加载速度极快,使得网络观看视频文件成为可能,它的出现也有效地解决了视频文件导入Flash后,使导出的SWF文件体积庞大,不能在网络上很好的使用等缺点。目前各在线视频网站均采用此视频格式。如新浪播客、56、优酷、土豆、酷6等,无一例外。FLV已经成为当前视频文件的主流格式。这些网站一般都不提供下载。我们想要这些素材,怎样办?1.寻找下载方法:a)在百度网站搜索栏中输入下载的内容,搜索下载方法。b)弄清格式,再搜索方法。2.具体方法推荐①flasah动画的下载方法一:IE缓存中寻找在网上看过一个flash后,一般情况下都会保存在IE缓存里。右击桌面上的IE图标,选“属性”命令,单击中间的“设置”按钮,弹出“Internet临时文件和历史记录设置”面板,单击“查看文件”,可以打开临时文件夹,按时间排序,找到刚才打开的flash动画文件。优点:不需要安装其它软件。缺点:操作相对烦琐。方法二:借助Flashsaver等软件下载,这些软件都可以快速、方便的下载你所需要的flash文件。优点:简单、方便、快速。缺点:需要安装使用。②FLV视频的获取方法一:IE缓存中寻找,方法同flasah。方法二:flv视频解析下载/三、学用控件,转化应用1.flash动画的插入方法一:安装flash插件,再插入flash。步骤:a)安装“ppt插flash软件”插件;b)单击“插入”→“flashmovie”→打开要播放的flash文件→确定。方法二:利用控件插入flash动画。步骤:a)插入“ShockwaveFlashObject”控件对象:右击“工具栏”→选“控件工具箱”(或点“视图→工具栏→控件工具箱”);点“其他控件”(控件工具箱中最后一个形似锤子斧头的按钮),拖动滚动条或在英文输入法状态下按键盘上“s”键,快速定位到以s开头的控件,选择“ShockwaveFlashObject”控件。将鼠标移到幻灯片工作区,鼠标指针变成“十”字型,拖动鼠标绘制出一个形似信封的矩形。b)打开控件对象“属性”对话框:右击矩形控件对象,在弹出的快捷菜单中选“属性”命令。c)正确设置控件对象属性:主要是在“Movie”空白文本域中正确输入演示文稿要播放的.swf动画的完整名称。d)将控件对象适当缩放:为了获得比较好的播放效果,拖动控件对象的缩放点使它几乎覆盖整个幻灯片工作区,但要在幻灯片工作区底部保留少许空白区域。这样既可以享受.swf动画大屏幕播放的好处,又能够保证幻灯片能够顺利地切换。e)一般情况下,幻灯片应显示出动画的第一帧图形。如果控件对象仍是空白的,可保存演示文稿,关闭后再打开它,按F5放映幻灯片,应该能够正确播放动画。2.FLV视频的插入FLV视频与FLASH不一样的。全称是flashvideo,所用的播放器也不一样。①利用控件插入PPT的方法也是有区别的。不同点:先要下载pptflv.swf文件,此文件是类似于网页中FLV视频播放器的一个Flash文件(可用百度搜索下载下来后记着要改文件名,保留扩展名);例如改成:pptflv1.swf“Movie”参数值填入方法不一样,参数值示例:pptflv.swf?file=视频.FLV“pptflv.swf”即为步骤一下载下来的Flash文件的完整文件,“视频.FLV”即为需要播放的FLV视频的文件名,大家只要将pptflv.swf换成自己下载后起的文件名,将“视频.FLV”换成自己的FLV视频文件名,则此FLV文件就可以在PowerPoint中播放了。如播放2.flv视频参数填法:示例:pptflv1.swf?file=2.FLV②方法二:将flv转换成swf再插入转换软件:UltraFlashVideoFLVConverter3.2.0软件说明:该软件又叫全格式FLV转换器,支持将几乎所有主流视频格式转换为FLV或者SWF且对用户较为关心的RealMedia(RM/RMVB...)和QuickTime(MOV/QT...)支持良好。三大特色功能:既可输出FLV格式,也可输出SWF格式,甚至同时输出FLV+SWF格式。此软件也支持创建调用播放的网页支持导入所有的主流字幕格式。srt,*.sub,*.idx,*.ssa,*.ass,*.psb,*.smi)有字幕合成功能,你现在无需再使用那些繁琐的专业软件来合成字幕到视频中去,字幕合成与格式转换一气呵成!支持视频分割,右键点击列表中的源文件,选择[编辑视频],自己设置下起点终点即可对视频进行去粗取精处理!③方法三:将flv转换成其他格式视频文件再插入工具:FLV转AVI(FreeFLVtoAVIConverter1.5)作用:一个免费的将FLV转换成AVI的软件,简单好用,自带解码器。四、学做交互,理解运用。1.利用母版进行交互母版≠模版母版和模版可以使课件统一整体风格,展现自己的个性和特点;模版是对同一类课件所做的整体风格统一设置,母版则是对某一部课件内部所做的个性化统一设置。母版设置得好,就可以存为模版,供别人在制作同类题材时使用。修改幻灯片母板的方法和技巧。如果我们希望为每一张幻灯片添加上一项固定的内容,并做超链接,可以通过修改“母板”来实现。a)执行“视图→母板→幻灯片母板”命令,进入“幻灯片母板”编辑状态。b)插入固定内容。例如:将图片插入到幻灯片中,调整好大小、定位到合适的位置上。c)给这张图片插入超链接,就可以进行交互了。d)单击“关闭母板视图”按钮退出“幻灯片母板”编辑状态。以后添加幻灯片时,该幻灯片上自动添加上该图片。如果说一个PPT有它的灵魂的话,那就是PPT的母板,它的作用犹如摩天大厦的根基一般。2.在PPT演示文稿中插入PowerPoint演示文稿对象实现交互具体效果:①导航目录内容展示效果②单击小图片就可看到该图片的放大图自动缩效果《画家乡》一课五个画面交互的具体操作方法:a)单击“插入→对象”,在出现的选择页中选择“MicrosoftPowerPoint演示文稿”,单击确定。此时就会在当前幻灯片中插入一个“PowerPoint演示文稿”的编辑区域。b)在此编辑区域中我们就可以对插入的演示文稿对象进行编辑了,编辑方法与PowerPoint演示文稿的编辑方法一样。c)在插入的演示文稿对象中创建所需的幻灯片。可将图片设置为幻灯片相同大小,退出编辑后,就可发现图片以缩小方式显示了(其实是整个插入的演示文稿对象被缩小显示了)。d)最后,我们只需对剩余的图片进行插入。为了提高效率,可将这个插入的演示文稿对象进行复制,并按照上面的方法对图片进行替换即可。e)完毕后,单击“观看放映”命令进行演示,单击小图片马上会放大,再单击放大的图片马上又返回到了浏览小图片的幻灯片中了。原理:这里的小图片实际上是插入的演示文稿对象,它们的“动作设置”属性中的“单击鼠标”中的“对象动作”被设为了“演示”(这是默认值)。因此我们在演示时,单击小图片,就是等于对插入的演示文稿对象进行“演示观看”。而演示文稿对象在播放时就会自动全屏幕显示。所以我们看到的图片就好像被放大了一样,而我们单击放大图片时,插入的演示文稿对象实际上已被播放完了(因为只有一张),它就会自动退出,所以就回到了主幻灯片中了。3.用触发器控制自定义动画进行交互以前我们在使用PowerPoint制作课件时,常常发现制作人机交互性的课件非常麻烦。其实在PowerPoint2003里,用触发器控制自定义动画可以轻松地制作出交互性很强的课件。触发器功能可以将画面中的任一对象设置为触发器,单击它,该触发器下的所有对象就能根据预先设定的动画效果开始运动,并且设定好的触发器可以多次重复使用。类似于Authorware、Flash等软件中的热对象、按钮、热文字等,单击后会引发一个或者的一系列动作。例1:单击“棱台”后,“小球”开始按一定路径运动。例2:分别单击“变色一”和“变色二”,让“笑脸”颜色。例3:单击下面一段话的关键词,让词语变红色读下面一段话,说说从哪些词语中可以看出侵略者采用了各种野蛮手段掠夺、毁灭圆明园的?他们把园内凡是能拿走的东西,统统掠走,拿不动的,就用大车或牲口搬运。实在运不走的,就任意破坏、毁掉。步骤:a)将原来段落中的重点词消去;(将词语颜色变成和背景色一样)b)将重点词作为单独文本覆盖到原来位置;c)设置重点词自定义动画为“添加效果→强调→更改字体颜色→红色”d)右击重点词自定义动画,选择“效果选项”,选择“计时”,选择“触发器”,选“单击下列对象时启动效果”,再选重点词,按确定。五、学会截取,合理选用。(一)视频的截取加工1.工具:万能转换器(英文名TotalVideoConverter)作用:可以帮助你快速的分割,修整大的AVI、MPEG、ASF或者WMV文件为一个个小的视频文件,内置视频播放器,你可以很方便的按照所选择的播放时间进行切割操作,不需要另外具备高深的技术知识,简单容易使用!2.绘声绘影会声会影是一套操作最简单,功能最强悍的DV、HDV影片剪辑软件。不仅完全符合家庭或个人所需的影片剪辑功能,甚至可以挑战专业级的影片剪辑软件。(二)flash的片段截取有时候,在网络上下载了一个课件,对自己的课堂教学有帮助,但是又不想全部应用这个课件,只想取出其中一部分,应该则么办呢?先用硕思闪客精灵将.swf文件和.exe文件转换成fla文件,再用flash8打开进行编辑,截取自己所需的片段,然后插入到ppt里面为我所用。1.硕思闪客精灵:它是一款用于浏览和解析Flash动画(.swf文件和.exe文件)的工具。最新版本有着强大的功能,可以将swf文件导出成FLA文件。它还能够将flash动画中的图片、矢量图、声音、视频(*.flv)、文字、按钮、影片片段、帧等基本元素完全分解,最重要的是可以对动作的脚本(Actionscript)进行解析,清楚的显示其动作的代码,让对Flash动画的构造一目了然。支持将SWF文件导出成FLA文件,帮助丢失FLA文件的影片作者重新获得FLA文件,从而可以再编辑。完全兼容Flash8文件和动作脚本(ActionScript)2.0。硕思闪客精灵支持将包含组件的SWF文件转换成FLA格式,用户可以在Flash中编辑这些组件。支持解析Flash影片中的视屏(video)文件,并将Flash影片中的视频文件导出为*.flv格式。2.硕思闪客精灵具体使用方法:①解析Flash课件,提取课件素材在Flash课件作品中有大量的图片、声音和视频等资源。由于制作者拥有的资源不同,在制作课件时,很难及时、方便地寻找到适合的素材。如果可以从同类作品中将所需要的资源提取出来为己所用的话,不仅大大节约了搜集素材资源的时间,而且会极大地提高课件利用率。但是,Flash课件发布时一般都进行加密处理,使教师无法用普通的方式导入到Flash中进行编辑。而硕思闪客精灵可以解析出Flash作品中的元件及脚本,并且可以保存成swf格式,这样在创作时就可以直接导入Flash中使用。启动闪客精灵,单击工具上的“快速打开”按钮打开一个Flash动画(可以是swf格式或exe格式),闪客精灵会自动分解当前动画(图2),包括用到的脚本语言(Actions语句),并在资源栏中分类罗列着动画中的各种元件(图片、按钮、影片和声音等);单击某个元件,可以在中间的窗口中预览;勾选需要的元件,然后单击“导出”按钮,就可以把选中的元件分类保存到原文件所在的文件夹中。②反编译Flash课件,获取课件源代码硕思闪客精灵的最大亮点就是能够将Flash动画(swf格式)还原成其源文件(Fla格式),相信这个功能是很多朋友期待已久的。还原的方法十分的简单,只需要打开Flash动画,再单击工具栏上的“导出Fla”按钮,选择保存位置,稍等后就完成了还原工作,此时还会提示“是否愿意用Flash打开它”,单击“Yes”即可启动系统中安装的Flash打开还原后的源文件,此时你就可以随心所欲地对它进行修改啦。3.用flash8进行编辑基本方法:选取需要帧,复制,粘贴到新的flash中,调试修改。上面介绍了关于破解Flash课件的一些方法和手段,有一个特定的使用范围,即为了课堂教学服务,只有资源共享才能提高教学效率,促进教学效果的提高。不能做为商业目的,也不能将别人的课件的署名修改一下,便成为自己的作品,用于参加比赛,这是不道德的行为。在PPT演示中禁用右键快捷菜单和滑鼠滚动一大群与会人员正襟危坐,你豪情满怀地进行着某个新产品的演示或介绍,却不小心由于鼠标左键的误操作导致幻灯片跳到了本不应该出现的位置,或者本应按下鼠标左键切换到下一张,却由于按下了右键而出现一个快捷菜单。不用担心,只要进行小小的设置,就可以将这些烦人的问题统统搞定。从任务窗格中打开“幻灯片切换”,将换片方式小节中的“单击鼠标时”和“每隔”两个复选项全部去除,然后将这个设置应用于所有幻灯片,以后切换到下一张或上一张,只有通过键盘上的方向键才能进行操作。至于另外一个问题,解决的办法也很简单,从“工具”菜单下打开“选项→视图”窗口,取消“幻灯片放映”小节上的“右键单击快捷菜单”复选框即可。■在PPT演示文稿内复制幻灯片要复制演示文稿中的幻灯片,请先在普通视图的“大纲”或“幻灯片”选项中,选择要复制的幻灯片。如果希望按顺序选取多张幻灯片,请在单击时按Shift键;若不按顺序选取幻灯片,请在单击时按Ctrl键。然后在“插入”菜单上,单击“幻灯片副本”,或者直接按下“Ctrl+shift+D”组合键,则选中的幻灯片将直接以插入方式复制到选定的幻灯片之后。■Powerpoint自动黑屏在用Powerpoint展示课件的时候,有时需要学生自己看书讨论,这时为了避免屏幕上的图片影响学生的学习注意力可以按一下“B”键,此时屏幕黑屏。学生自学完成后再接一下“B”键即可恢复正常。按“W”键也会产生类似的效果。■将幻灯片发送到word文档1、在Powerpoint中打开演示文稿,然后在“文件”菜单上,指向“发送”,再单击“MicrosoftWord”。2、在“将幻灯片添加到Microsoftword文档”之下,如果要将幻灯片嵌入word文档,请单击“粘贴”;如果要将幻灯片链接到word文档,请单击“粘贴链接”。如果链接文件,那么在Powerpoint中编辑这些文件时,它们也会在word文档中更新。3、单击“确定”按钮。此时,系统将新建一个word文档,并将演示文稿复制到该文档中。如果word未启动,则系统会自动启动word。■让幻灯片自动播放要让powerpoint的幻灯片自动播放,只需要在播放时右键点击这个文稿,然后在弹出的菜单中执行“显示”命令即可,或者在打开文稿前将该文件的扩展名从PPT改为PPS后再双击它即可。这样一来就避免了每次都要先打开这个文件才能进行播放所带来的不便和繁琐。■增加PPT的“后悔药”在使用powerpoint编辑演示文稿时,如果操作错误,那么只要单击工具栏中的“撤消”按钮,即可恢复到操作前的状态。然而,默认情况下Powerpoint最多只能够恢复最近的20次操作。其实,powerpoint允许用户最多可以“反悔”150次,但需要用户事先进行如下设置:在“工具-选项”,击“编辑”选项卡,将“最多可取消操作数”改为“150”,确定。■PPT中的自动缩略图效果你相信用一张幻灯片就可以实现多张图片的演示吗?而且单击后能实现自动放大的效果,再次单击后还原。其方法是:新建一个演示文稿,单击“插入”菜单中的“对象”命令,选择“Microsoftpowerpoint演示文稿”,在插入的演示文稿对象中插入一幅图片,将图片的大小改为演示文稿的大小,退出该对象的编辑状态,将它缩小到合适的大小,按F5键演示一下看看,是不是符合您的要求了?接下来,只须复制这个插入的演示文稿对象,更改其中的图片,并排列它们之间的位置就可以了。■快速灵活改变图片颜色利用powerpoint制作演示文稿课件,插入漂亮的剪贴画会为课件增色不少。可并不是所有的剪贴画都符合我们的要求,剪贴画的颜色搭配时常不合理。这时我们右键点击该剪贴画选择“显示‘图片’工具栏”选项(如果图片工具栏已经自动显示出来则无需此操作),然后点击“图片”工具栏上的“图片重新着色”按钮,在随后出现的对话框中便可任意改变图片中的颜色。■为PPT添加公司LOGO用powerpoint为公司做演示文稿时,最好第一页都加上公司的Logo,这样可以间接地为公司做免费广告。执行“视图-母版-幻灯片母版”命令,在“幻灯片母版视图”中,将Logo放在合适的位置上,关闭母版视图返回到普通视图后,就可以看到在每一页加上了Logo,而且在普通视图上也无法改动它了。■“保存”特殊字体为了获得好的效

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论