已阅读5页,还剩3页未读, 继续免费阅读
版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
ASCII 是一种字符集,包括大小写的英文字母、数字、控制字符等,它用一个字节表示,范围是 0-127Unicode分为UTF-8和UTF-16。UTF-8变长度的,最多 6 个字节,小于 127 的字符用一个字节表示,与 ASCII 字符集的结果一样,ASCII 编码下的英语文本不需要修改就可以当作 UTF-8 编码进行处理。Python 从 2.2 开始支持 Unicode ,函数 decode( char_set )可以实现 其它编码到 Unicode 的转换,函数 encode( char_set )实现 Unicode 到其它编码方式的转换。比如 (”你好”).decode( “GB2312) 将得到 uu4f60u597d,即 “你”和“好”的 Unicode 码分别是 04f60 和 0597d再用 (uu4f60u597d).encode(”UTF-8) 将得到 xe4xbdxa0xe5xa5xbd,它是 “你好”的UTF-8编码结果。python中使用 unicode的关键:unicode是一个类,函数unicode(str,”utf8)从utf8编码(当然也可以是别的编码)的字符串str生成 unicode类的对象,而函数unc.encode(”utf8)将unicode类的对象unc转换为(编码为)utf8编码(当然也可以是别的编码)的字符串。于是,编写unicode相关程序,需要做的事情是 * 获取数据(字符串)时,用unicode(str, “utf8)生成unicode对象 * 在程序中仅使用unicode对象,对程序中出现的字符串常量都以u”字符串”的形式书写 * 输出时,可将unicode对象转换为任意编码输出,使用str.encode(”some_encoding”) unicode(”你好”, “utf8)uu4f60u597d x = _ type(x) type(”你好”) x.encode(”utf8)xe4xbdxa0xe5xa5xbd x.encode(”gbk”)xc4xe3xbaxc3 x.encode(”gb2312)xc4xe3xbaxc3 print x你好 print x.encode(”utf8)你好 print x.encode(”gbk”)?以上是测试结果(Ubuntu 6.06,locale为utf8),注意type(x)和type(”你好”)的区别。从编码上可以看出utf8编码与gbk不同。在utf8的 locale设置下,打印x按该环境变量编码(我猜我猜我猜猜猜),而打印x.encode(”gbk”)则是乱码。python使用FTP来源: 作者: 发布时间:2007-09-10 阅读次数: import ftplibftp = ftplib.FTP()ftp.connect(,21)ftp.login(anonymous, 123)ftp.dir()ftp.quit()下载用这个:ftp.retrbinary(RETR +filename, open(filename,wb).write)上传用这个ftp.storbinary(STOR +filename, open(filename, rb)怎么处理cookie啊?来源: 作者:zhaoweikid 发布时间:2007-09-10 阅读次数: import urllib2,cookielibimport urllibcookie=cookielib.CookieJar()opener=urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie)urllib2.install_opener(opener)login_response=urllib2.urlopen() 使用 python 破除网页限制来源:albertlee 作者:albertlee 发布时间:2007-07-05 阅读次数: 昨天找到一个比较好的人工智能网站, 其中有一些很不错的 prolog 文章,我很感兴趣。文中有很多示例程序,可是网页的右键被禁止了,也不能选择,不能保存,不能察看源代码! 实在不爽,信息本来就要共享嘛! 只好发扬下 hack 精神,冲破限制。还好,有 python 方便多了。 网页中增加限制,无非是在 html 中设置脚本,既然浏览器可以显示出来,就一定能得到它的文本。第一步,在 python shell 中执行: import urllib urllib.urlretrieve(/Article_Show.asp?ArticleID=315,c:/tmp.html)urlretrieve 可以把一个网页保存到本地文件。第二步,分析这个 tmp.html 文件,发现其中的 标签比较恶心:body leftmargin=0 topmargin=0 onmousemove=HideMenu() oncontextmenu=return false ondragstart=return false onselectstart =return false onselect=document.selection.empty() oncopy=document.selection.empty() onbeforecopy=return false onmouseup=document.selection.empty()把这个标签换成比较干净的:body leftmargin=0 topmargin=0 onmousemove=HideMenu() (注意, 在这里省略了)浏览这个文件, ok 限制解除。第三步, 自动下载网页,进行“净化”处理, 编写一个python 程序:import urlliburls = /Article_Show.asp?ArticleID=315:prolog2.htmlnew_tag = for url in urls: filename = urlsurl urllib.urlretrieve(url,filename) f = open(filename,r) content = f.read() f.close() l_pos = content.find(, l_pos) cont1 = content:l_pos cont2 = contentr_pos + 1: content = cont1 + new_tag + cont2 f = open(tmp.html,w) f.write(content) f.close()程序中 urls 是一个 字典,里面是 url 和 相应的本地文件名, 使用者可以根据自己的情况添加。注意,这个程序是专门针对这个网站的, 对于其他的网站,可能使用的方法会有不同,但是按照上面的步骤,相信大家都能搞定。使用 python 破除网页限制来源:albertlee 作者:albertlee 发布时间:2007-07-05 阅读次数: 昨天找到一个比较好的人工智能网站, 其中有一些很不错的 prolog 文章,我很感兴趣。文中有很多示例程序,可是网页的右键被禁止了,也不能选择,不能保存,不能察看源代码! 实在不爽,信息本来就要共享嘛! 只好发扬下 hack 精神,冲破限制。还好,有 python 方便多了。 网页中增加限制,无非是在 html 中设置脚本,既然浏览器可以显示出来,就一定能得到它的文本。第一步,在 python shell 中执行: import urllib urllib.urlretrieve(/Article_Show.asp?ArticleID=315,c:/tmp.html)urlretrieve 可以把一个网页保存到本地文件。第二步,分析这个 tmp.html 文件,发现其中的 标签比较恶心:body leftmargin=0 topmargin=0 onmousemove=HideMenu() oncontextmenu=return false ondragstart=return false onselectstart =return false onselect=document.selection.empty() oncopy=document.selection.empty() onbeforecopy=return false onmouseup=document.selection.empty()把这个标签换成比较干净的:body leftmargin=0 topmargin=0 onmousemove=HideMenu() (注意, 在这里省略了)浏览这个文件, ok 限制解除。第三步, 自动下载网页,进行“净化”处理, 编写一个python 程序:import urlliburls = /Article_Show.asp?ArticleID=315:prolog2.htmlnew_tag = for url in urls: filename = urlsurl urllib.urlretrieve(url,filename) f = open(filename,r) content = f.read() f.close() l_pos = content.find(, l_pos) cont1 = content:l_pos cont2 = contentr_pos + 1: content = cont1 + new_tag + cont2 f = open(tmp.html,w) f.write(content) f.close()程序中 urls 是一个 字典,里面是 url 和 相应的本地文件名, 使用者可以根据自己的情况添加。注意,这个程序是专门针对这个网站的, 对于其他的网站,可能使用的方法会有不同,但是按照上面的步骤,相信大家都能搞定。Python模块之chardir: 使用chartdir生成各种图表来源: 作者:zhaoweikid 发布时间:2007-07-04 阅读次数: 使用chartdir来生成图表真的是太方便了!可以用与web中生成图片,也可以作为单独的应用程序生成各类统计图,非常实用,也非常的好用,还跨平台。美中不足的是图片中使用中文的时候有些问题,因为使用了PIL来生成图片,偏偏PIL对中文的支持不够。它的官方网站是 /download.html它同时也提供 ChartDirector for ASP/COM/VB Chart
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- GB/T 42707.2-2024数控机床远程运维第2部分:故障诊断与预测性维护
- 着力构建泛在可及的终身教育体系
- 2025新译林版英语七年级下单词默写表
- 湖南部分学校2024-2025学年高三年级上册9月联考英语试题
- 公司年终总结会议通知-企业管理
- 2024年电离辐射计量标准器具项目投资申请报告代可行性研究报告
- 2025届高考英语二轮复习专项(中国日报新闻改编)时事新闻语法填空 (社会与体育)(3篇含答案)
- 强制清算中应注意的问题
- 强化硬件-拓展软件-细化预算管理工作
- 单选之连词 介词(解析版)
- 建设工程项目施工安全评价书(共10页)
- 机场助航灯光设计讲解
- 消毒记录台账
- 应急救援物资管理台账【精选文档】
- 随机过程教学大纲
- EPC项目—承包人实施方案__承包人实施计划
- 塑料门窗设计及组装技术规程
- 最新空白办健康证用工证明1页
- 工程结算书(完整版)
- SPECTRO直读光谱仪使用PPT学习教案
- 急性肾盂肾炎护理查房
评论
0/150
提交评论