怎么使用PRO 进行网页下载_第1页
怎么使用PRO 进行网页下载_第2页
怎么使用PRO 进行网页下载_第3页
怎么使用PRO 进行网页下载_第4页
怎么使用PRO 进行网页下载_第5页
已阅读5页,还剩5页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Teleport Pro按步就班出处:PConline责任编辑:zyq02-2-9 15:18 作者:Aeolus/goEway 前言与特点经常有不少网友写信来goeway,问如何做才可以把整个站点复制到硬盘上慢慢看,或者问teleport Pro的使用方法。的确,离线浏览工具对于大部分网民来说是一个不错的工具,除非你是从事互联网企业吧呵呵,不然,在线浏览的确是很浪费的。应大家的要求,所以我们整理了一篇关于Teleport Pro的基础教程,希望可以帮助新手尽快掌握Teleport Pro。Teleport Pro的主界面 TeleportPro是个功能强大的离线浏览器,用它可以: (1)方便

2、且完全地下载整个网站以便你离线浏览,比起你网上浏览自然快上数十倍。 (2)建立一个完全相同的站点,保留原有站点的子目录结构和所有需要的文件。 (3)搜寻站点上特定类型的文件(甚至可以根据文件大小)。 (4)自动从网上下载一连串的文件。 (5)探索所有与站点链接的其他站点。 (6)根据关键字来搜寻站点。 (7)制作某一个站点上的所有网页和文件的清单。一、TeleportPro的基本使用方法: 打开TeleportPro,单击“Add Project Wizard”(增加项目向导)图标,开始设置(图2)。在新项目窗口中选择一种下载方式,一般选第一种,按“下一步”。在选择地址窗口中输入地址,可以给这

3、个地址起一个名字以便于记忆,也可以不起名字,系统将用地址作名字。按“下一步”。 选择下载内容,是纯文本,还是文本加图像,共有四种选项。同时,还有一个帐号和密码选项。注意,它不是上网的帐号和密码,而是在上网之后,与某些需要帐号和密码的链接进行连接时所用的帐号和密码。完成,取一个文件名,按“保存”键,就做好一个项目文件。按下工具栏中的“开始下载”按钮即可进行下载。下载完后,单击浏览窗口中的索引文件,即可浏览下载内容。 上一页 下一页二、TeleportPro进阶 在实际使用TeleportPro时,你会发现它并不如想象的那么好用,比如下载一个不大的网站,用时却长达几个小时,耐不住时间和金钱的耗费,

4、断开连接,看看下载内容,你会又气又恼,不想下载的内容下载了,而想下载的内容还没下载完。问题出在哪儿?没设置好呗。单击工具栏中的“属性”按钮,TeleportPro的设置主要有这些,下面详细为您介绍: 1.属性之概况(Summary)这里是项目的基本情况,如读取多少页、下载多少文件、多少字节(仅仅是介绍而已,并非设置)等等。这里的“Clear Project Database”(清理项目数据)相当于系统初始化,它将清除用户进行的所有设置和下载的内容,所以没有把握不要按它。最后一行是自动保存数据的间隔时间,因为TeleportPro先把下载内容放在内存中,而不是放在磁盘上,这样做可以节省时间,如果

5、不选此项,TeleportPro会在完全下载之后,或内存没有空间时将下载内容存放到硬盘上。当然还是设个定时存盘放心,否则一旦掉电,你哭去吧,没人可怜你。 上一页 下一页2. File Retrieva(文件下载) 此窗口分为两部分,第一部分可以规定下载文件的大小,超过规定字节的文件不下载,如果规定为0,则下载所有文件;还可以规定下载的文件类型,可用通配符*和?,如*.html、*.gif等,如果你喜欢某个站点的图片,可在此设置只下载图片文件,而把其他类型的文件过滤掉。 第二部分为下载模式(Retrieval Mode),它有几个选项,一是下载所有文件,一般此项要选中,但如果你只下载大于一定字节

6、的文件时,这项要关掉;二是选择是否下载背景图片;三是是否下载JAVA小程序;四是只下载文件名。第四项看似无用,实际很有用,因为选中此项后下载速度非常快,这样在文件列表中可以检查你的设置是否生效,如你设置不下载某一地址的内容,但你没有信心,不知设置是否正确,可打开这一选项,在最短的时间内检检验设置的效果。 上一页 下一页3. 浏览/映像(Browsing/mirroring) 在这里定义TeleportPro如何在你的磁盘上保存文件,如何定位链接等。 一个HTML并不能包含所有网页中所能看到的东西,比如图片吧,因为图片文件不包含在HTML文件之内。选中“Always save HTML page

7、s”(完整保存HTML页)就可以完整下载HTML页。“Replicate the directory structure of remote servers”(复制远程服务器目录结构),是把下载下来的文件按远程服务器目录结构进行保存,这样可以精确复制网站结构;如果不选,所有文件都将放在同一目录下,有可能出现重名情况,遇到这种情况,TeleportPro会自动将重名文件进行改名保存。但在实际使用中,TeleportPro对重名文件的修改,有可能出现停滞情况,好像死机一般,所以建议在下载地址较多时,最好选中此项,以免出差错,尤其是在无人看守或自动下载之时,长时间不工作,却占用线路,耗费网络费和电话

8、费,这个损失太大了。微软的Internet Explorer只把*.htm或*.html当作HTML文件,但是很多网站的HTML文件的扩展名不是*.htm或*.html,如*.shtml或*.pl,这样IE就不认为它们是HTML,选中“Use MSIE-compatible file names”(使用MSIE兼容文件名),就可以解决这个问题。“Localize links for retrieved files”(为下载文件定位链接)选中此项后离线浏览时就可以像浏览网站一样浏览下载内容。一个网站不一定要全部下载,如果在离线浏览时点中了没有下载的链接,TeleportPro有三个选项供你选择:

9、一是显示不能离线浏览的原因,二是直接连接到Internet,三是连接到一个定位文件存放的位置,这样下次使用TeleportPro时,它自动把这个链接的内容下载下来,不劳烦你亲自动手。“Link using 8.3 file names”是使用8个字符的文件名和3个字符的扩展名的DOS文件名格式来保存文件;“Relink all files in the project now”按钮是立刻重写项目文件夹中所有HTML文件的连接,这个按钮很少使用。 上一页 下一页4. 探索(Exploration) TeleportPro之所以快,是因为它可以同时多线下载,东方不亮西方亮,哪个空闲下载哪个,但到底

10、同时多少线连接合适?“Launch up XX retrieval threads”允许你选择,默认为10,其实10个连接同时工作基本是满负荷了,没必要再压担子。如果某个链接长时间没有反应怎么办?TeleportPro提供了“Abort threads that show no activity after XX seconds”选项,规定在服务器没有反应多长时间内自动断开连接,默认为360秒,这个时间有点长,可适当缩短一些。现在没反应,也许是因为线路太忙,过一会儿就会有反应,而TeleportPro已断开了这个链接,怎么办?这一点TeleportPro也为你想到了,Retrydeniedre

11、questsXtimes,就是让你选择对连接失败的链接重试连接的次数,默认为5次,其实三次足矣。因为掉线或其他原因,有些文件没有下载完整,TeleportPro的“Retryin complete requests XX times”选项设置没有下载完整的文件重新拨号连接的次数。 TeleportPro并不是傻乎乎地每次都完整地把同一个网站全部下载下来,而是只对有变化的文件进行更新,这样第二次以后的下载速度比第一次会明显提高。下载下来的文件情况不一样,有的是完整的,有的则不完整,TeleportPro给了你选择的权力,是只下载“好”文件,还是只下载“坏”文件,还是两者全下载;下载的文件类型是H

12、TML,还是其他,等等。一般只有HTML文件是经常更新的,其他文件更新频率很低,你可以每天更新HTML文件,而一周进行一次全面更新。5. 网络规范(Netiquette) 有的站点速度快,有的站点速度慢,“Enable Domain Dispersed Querying”允许TeleportPro与多服务器连接,这样可以避免在一条路上死等,从而提高下载速度;也正因为TeleportPro可同时多线连接,所以有时会出现Modem忙不过来的情况,如不加以限制,下载的文件有可能不全,或出其他错误,此时选中“Enable Server Overload Protection”可避免这一危险。太快了可以

13、慢下来,太慢了可以快起来,这两个选项是一定要选中的。“Robot Exclusion Standard”是在自动代理方面的网络标准,遵守它可以防止TeleportPro漫无边际地漫游,一般此项也要选中。诸如Internet Explorer、Netscape Navigater等网络用户程序在下载网站服务器文件时,网站服务器会要求用户“出示身份证”,“验明正身”方允许进入。“验身”的目的倒不是为了防小偷,而是视你的身份发送合适于你的文件,比如一些网站不会给老的Microsoft Internet Explorer发送frame links,因为它读不出这种链接,发送了也是白发,还浪费时间。那么

14、TeleportPro向网站服务器要求下载文件时用什么身份呢?TeleportPro给出了5个选择,一般使用Anonymous(匿名)即可。 上一页 下一页三、 TeleportPro高级使用1. Exclusions(排除) 这是一个非常有用的选项,把它玩熟了,你在别人眼里也是高手了,因为上面介绍的不少选项TeleportPro都为你设置好了,用不着你费心思,这里的选项却是必须由你根据实际情况来进行设置的,好在它并不复杂。第一栏是排除某些内容,意为:“不保存Web页,或者与某些Web页相链接的文件,除非页中包含以下的关键字”,哪些呢?你自己填。允许使用通配符*和?,还提供了大小写匹配和全词匹

15、配选项。比如你在此栏中输入“电脑”,不选“全词匹配”,则TeleportPro只下载包含“电脑”两字的Web页,没有这两个字的Web页不下载。不过有时做了规定,而下载下来的Web页中并不包含规定的关键字,是TeleportPro出错了吗?非也,TeleportPro会把在HTML代码或解释中包含你输入的关键字的Web页也下载下来,所以出现“出错”假象。第二栏是排除某些文件,用DOS文件名形式表示。如在此栏中输入“*.GIF”,则表示下载除以GIF为扩展名的所有其他文件,这个选项比较容易理解。第三栏是排除某些网址,HTTP地址一定要加上“http:/”。这个选项的用处比上两个要大,举一个最简单的例子:某网站的结构在主页下有A、B、C三个次页,现在要下载A页的内容,那么就要排除B和C这两个网址。但实际情况是复杂的,因为网页相互之间的链接特别多,所以要设置得科学也是不容易的。尽量把排除级设高些,这样出问题的机会少,即设置为“ 2. Advanced(高级) 这里是一些自动化设置,主要用于无人监控的预定(Schedule)下载(图10)。“Automatically begin

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论