Python爬虫与网页设计实践报告_第1页
Python爬虫与网页设计实践报告_第2页
Python爬虫与网页设计实践报告_第3页
Python爬虫与网页设计实践报告_第4页
Python爬虫与网页设计实践报告_第5页
已阅读5页,还剩14页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

实践报告Python爬虫与网页设计成果名称:Python爬虫与网页设计-23-实践活动题目校内华为大数据项目实训一、实践目的1.了解并掌握Python语言的基本语法,并会自己用Python语言写一些简单的程序代码;2.熟悉前端特性css、html、js3.学会用html创建各式各样的网页,例如:人人网登录界面,京东界面,淘宝界面,QQ登录界面;二、实践内容1.基本语法(1)小心引用!(2)2和3的常见差异(3)print数据类型统一,取消unicode和longutf8:3.x代码默认utf-82.显示保留字显示结果:3.标识符基本规则:由字母,下划线和数字组成,并且第一个字符不能是数字,可以使用的标识符字符有:a-z,A-Z,0-9,“_”如:USERID,book,user_id,myclass,book01注意事项:(1)不能是Python的保留字(2)不能包含空格,@,%,$(3)可以中文,但是我们不建议使用中文(4)严格区分大小写4.数据类型(1)数值类型分为:整数和小数整数包括正整数,负整数,0,并且它的位数是任意的浮点数由整数部分和小数部分组成,主要用于处理包括小数的数。(2)字符串类型字符串就是连续的字符序列,可以是计算机所能表示的一切字符集合。字符串属于不可变序列,通常使用单引号‘’或者双引号“”或者三引号‘’‘’‘’或“”“”“”括起来,这三种引号形式再语义上没有差别,只是再形式上有差别。其中单引号和双引号的字符串序列必须再一行上,而三引号内的字符序列可以分布再连续的多行上。(3)布尔类型布尔类型主要用来表示真或者假的值。标识符True和False被解释为布尔值。布尔值可以转化为数值,其中True表示1,而False表示0用Python进行网络爬虫:步骤一:python的下载(1)首先,进入到python官网,你可以直接输入python主页,也可以从百度搜索框进入到python的主页,这里方法很多,我不在一一例举了,然后在主页上面可以看见Downloads字样,点击下载,然后跳转出下载界面。下载界面选择版本(3)安装好后,按windows键加R键,弹出运行窗口,在运行窗口输入cms进入到命令行界面,然后输入python,如果安装成功,即可进入到python交互界面,如果没有则表示python没有安装成功。步骤二:爬虫准备(1)爬虫首先需要做的事情就是要确定好你想要爬取数据的对象.百度界面(2)首先,是打开百度主页界面,然后把鼠标移动到主页界面的百度logo图标上面,点击鼠标右键,然后点击审查元素,即可打开开发者界面。(3然后再下面的界面里面,可以看到该logo图标在HTML里面的排版模式,<imghidefocus="true"src="//baidu/img/bd_logo1.png"width="270"height="129">开发者界面步骤三:开始爬虫(1)首先,我们进行页面获取,python爬虫的话很多模块包提供给开发者直接抓取网页,urllib,urllib2,requests(urllib3)等等,这里我们使用urllib2进行网站页面的获取;首先导入urllib2模块包(该包是默认安装的):importurllib2;导入urllib2模块包(2)导入模块包之后,然后调用urllib2中的urlopen方法链接网站,代码如下repr=urllib2.urlopen("XXXXXX"),XXXXXX代表的是网站名称;(3)得到网站的响应之后,然后就是将页面的源代码读取出来,调用read方法,html=repr.read();调用read(4)获取到页面的源代码之后,然后接下来的工作就是将自己想要的数据从html界面源代码中解析出来,解析界面的模块包有很多,原始的re,好用的BeautifulSoup,以及lxml等等,这里用re介绍介绍,首先导入re模块包:importre;(5)然后进行利用re进行搜索;re搜索(6)然后就实现了一个简单的爬虫流程,打印url,可以看见刚好就是之前看见的百度主页logo的地址。源代码:importurllib2repr=urllib2.urlopen("URL")html=repr.read()importre省略一行代码printurl。用html设计网页认识网页网页主要由文字,和超链接等元素构成,当然除了这些元素,网页中还包含音频,视频以及Flash等。HTML初识超文本标HTML是一种用于创建网页的标准标记语言。网页文件的后缀是以.html。网页的形成前端程序员面写的→浏览器的渲染→客户眼中的美丽页面4.HTML骨架格式HTML有自己的语言语法骨架格式。<html><head> <title></title></head><body></body></html>5.开发工具的使用编写我们的第一个HTML页面!(1)打开HBuilderX新建一个项目;(2)打开index.html;(3)在<body></body>中间写入:给自己定一个小目标,经过5个月的努力,实现月薪过万(4)保存之后;(5)用浏览器打开文件。.6.HTML常用标签(1)段落标签:<p>...(2)水平线标签:<hr/>(3)换行标签:<br/>(4)<b></b>或者<strong></strong>字体加粗(5)<i></i>或者<em></em>斜体字(6)<s></s>或者<del></del>字体加删除线(7)<u></u>或者<ins></ins>字体加下划线7.图像标签img单词缩写:

image图像

HTML网页中任何元素的实现都要依靠HTML标签,要想在网页中显示图像就需要使用图像标签.

该语法中src属性用于指定图像文件的路径和文件名,他是img标签的必需属性。

<img

src="图像URL"

/>8.<input>标签<input属性/>一个重要的表单元素9.<input>标签的type属性type属性:text,password,checkbox,radio,button,submit,reset,image,file<inputreadonly/>控件只读<inputdisabled/>控件不可用<inputplaceholder=“请输入姓名"/>都是控件的属性html5支持10.表单域form<formaction=“提交表单的地址”method=“提交方式”>表单域中的表单元素</form>说明:action的值是一个提交表单的URL地址,method的值分别是get、post两种方式11.<label>标签(理解)<labelfor=“id名”>姓名</label>用于绑定一个表单元素,当点击label标签时会获得该表单的焦点我们通过for来绑定表单元素12.下拉菜单<selectname=“菜单名”> <optionvalue=“值”>显示值</option> <optionvalue=“值”>显示值</option> <optionvalue=“值”>显示值</option></select>13.文本域控件<textarea></textarea>文本域如果需要输入大量信息,就可以通过文本域轻松实现。cols属性:每行中的字符数rows属性:显示的行数14.H5酷炫表单元素<inputtype=“color”>调色板<inputtype=“date”>生日框<inputtype=“number”>数量栏14.链接标签<a><ahref=“目标链接”>...</a>超链接想去哪里点一下锚点定位:<ahref=“#id名”>...</a>跳转到锚点<h3id=“id名”></h3>锚点15.表格表格头:表头使用<th></th>代替原来的<td></td>表格标题:标题使用<caption>标题名称</caption>单元格合并:合并单元格属性:rowspan竖向跨单元格,colspan横向跨单元格用html进行完整的网页设计:1.确定网站主题(1)分析网站的功能,讲网站所有的功能再文档中体现;(2) 分析网站的主题,选择符合网站主题的方案。2.搜集材料(1)通过和与网站相关人员的接触、交流确定网站需要的模块,并将这些模块再文档中体现;(2)收集相关图片、文字、视频等资料;(3)将图片、文字和视频等资料使用相应的软件进行编辑备用(必须做);(4)对图片、文字和视频等资料分别分类整理;(5)所有素材的文件名都必须是非中文字符,并且要做到看到文件名就知道是哪张图片。网页设计实例:人人网登录界面:<!DOCTYPEhtml><htmllang="en"><head> <metacharset="UTF-8"> <title>人人网注册</title> </head> <body> <imgsrc="renren_titile.gif"alt=""/><br/> <p>人人网,中国<strong>最真实、最有效</strong>的社会平台,加入人人网,找回老朋友,结交新朋友。</p> 电子邮箱:<inputtype="email"/> <inputtype="submit"value="提交"/><br/><br/> 设置密码:<inputtype="password"size="30"maxlength="10"/><br/><br/> 真实姓名:<inputtype="text"size="30"maxlength="10"/><br/><br/> 性别:<inputtype="radio"name="sex"value="男"checked/>男<inputtype="radio"name="sex"value="女"/>女<br/><br/> 生日:<select> <optionvalue="1990">1990</option> <optionvalue="1991">1991</option> <optionvalue="1992">1992</option> <optionvalue="1993">1993</option> <optionvalue="1994">1994</option> <optionvalue="1995">1995</option> <optionvalue="1996">1996</option> <optionvalue="1997">1997</option> <optionvalue="1998">1998</option> <optionvalue="1999">1999</option> </select>年份 <select> <optionvalue="一月">一月</option> <optionvalue="二月">二月</option> <optionvalue="三月">三月</option> <optionvalue="四月">四月</option> <optionvalue="五月">五月</option> <optionvalue="六月">六月</option> <optionvalue="七月">七月</option> <optionvalue="八月">八月</option> <optionvalue="九月">九月</option> <optionvalue="十月">十月</option> <optionvalue="十一月">十一月</option> <optionvalue="十二月">十二月</option> <select/>月份<br/> <p>为什么要填写我的生日?<p/> 我现在<select> <optionvalue="请选择身份"cheched>请选择身份</option> <optionvalue="医生">医生</option> <optionvalue="教师">教师</option> <optionvalue="自由职业">自由职业</option> <select/>(非常重要)<br/><br/> <imgsrc="renren_code.gif"alt=""/> <ahref="#">看不清,换一张</a><br/><br/> 验证码:<inputtype="text"size="30"maxlength="10"/><br/><br/> <imgsrc="renren.gif"alt=""/> </body> </html>2.QQ会员<!DOCTYPEhtml><html> <head> <metacharset="utf-8"> <title></title> <styletype="text/css"> #main{ height:100px; background-color:#666666; padding-left:80px; padding-top:10px; } #mainimg{ width:120px; } #mainimg,div{ vertical-align:middle; } #caidan{ display:inline-block; } #caidanul,li{ list-style:none; float:left; margin:8px; margin-right:20px; color:#FFFFFF; } #caidanullia{ text-decoration:none; } #caidanullia:link{ color:#FFFFFF; } #caidanullia:visited{ color:#FFFFFF; } #caidanullia:hover{ color:orange; } #anniu{ display:inline-block; margin:30px; } #anniu#denglu{ display:inline-block; border:1px#E1D5A5solid; width:70px; height:30px; color:#E1D5A5; border-radius:30px; text-align:center; line-height:30px; } #anniu#denglu:hover{ color:black; background:#E1D5A5; } #anniu#huiyuan{ display:inline-block; border:1px#FFA500solid; height:30px; width:120px; text-align:center; line-height:30px; border-radius:40px; color:#8F6809; background:#E1D5A5; margin-left:10px; } </style> </head> <body> <divid="main"> <imgsrc="img/logo.png">; <divid="caidan"> <ul> <li><ahref="#">超级会员</a></li> <li><ahref="#">年费专区</a></li> <li><ahref="#">成长体系</a></li> <li><ahref="#">会员活动</a></li> <li><ahref="#">生活特权</a></li> <li><ahref="#">游戏特权</a></li> <li><ahref="#">功能特权</a></li> </ul> </div> <divid="anniu"> <divid="denglu"> 登陆 </div> <divid="huiyuan"> 开通超级会员 </div> </div> </div> </body></html>3.当当网<!DOCTYPEhtml><html><headlang="en"><metacharset="UTF-8"><title>完善当当购物车页面</title><linktype="text/css"rel="stylesheet"href="css/cartStyle.css"/></head><body><divclass="content"><divclass="logo"><imgsrc="images/dd_logo.jpg"><spanonclick="close_plan();">关闭</span></div><divclass="cartList"><ul><li>¥<inputtype="text"name="price"value="21.90"></li><li><inputtype="button"name="minus"value="-"onclick="minus(0);"><inputtype="text"name="amount"value="1"><inputtype="button"name="plus"value="+"onclick="plus(0);"></li><liid="price0">¥21.90</li><li><ponclick="collection();">移入收藏</p><ponclick="del();">删除</p></li></ul><ul><li>¥<inputtype="text"name="price"value="24.00"></li><li><inputtype="button"name="minus"value="-"onclick="minus(1);"><inputtype="text"name="amount"value="1"><inputtype="button"name="plus"value="+"onclick="plus(1);"></li><liid="price1">¥24.00</li><li><ponclick="collection();">移入收藏</p><ponclick="del();">删除</p></li></ul><ol><liid="totalPrice"> </li><li><spanonclick="accounts();">结算</span></li></ol></div></div><scripttype="text/javascript"src="js/shopping.js"></script></body></html>三、实践过程第一周实训老师带我们学习了Python语言,并且由浅入深,最后带领我们学习了用Python进行网络爬虫,第一周我感觉得非常困难,但是我不断的搜索资料,不断的问彭翔老师,再加上自己的练习,让我更加熟练的运用python,老师带领我们完成了许多有趣的作业,我对python产生了浓厚的兴趣。第二周开始进行html网页设计的讲解,开始先讲了许多做基本的步骤和设计网页时的基本语句,方便后面的学习与设计。后来,由易到难,从最开始的简单的网页,到后来的人人网登录界面设计、当当书城页面设计、QQ会员界面设计。本周的学习比第一周知识点更加抽象,学起来也比较枯燥,但我没有放弃,晚上回去继续研究老师上课的PPT,完成老师上课布置的相关作业,遇到问题时问问班中的大佬,做到不耻下问,让我对抽象的知识更加了解,此次的html有更强的实用性,让我了解到实践的重要性,html确实在人人网登录界面设计、当当书城页面设计、QQ会员界面设计有着较强的应用,彭翔老师说学好html会对今后的求职方面有很大帮助,因此要下苦功夫,更加努力,为以后的求职道路打下坚实的基础;第三周讲解了MySQL语句和相关代码,也是实训过程中最难得一部分,用了大量的时间进行讲解,也是与网页设计相挂钩的,此次的mysql学习中跟我们在课堂上学的更具有实践性,在课堂上比较熟练地掌握了mysql相关语句和相关代码,但是没能很好的掌握mysql的实用性,在第三周的相关知识和相关练习以后,自己也能很好灵活运用mysql,彭翔老师也给我们灌输了有关相关专业的必备证书,考一个数据库管理员,在以后的就职方面能有一个理想的薪资,我想今后能在这方面下苦功夫,为以后的工作打下坚实的基础。第四周

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论