外链hrefer最全教程_第1页
外链hrefer最全教程_第2页
外链hrefer最全教程_第3页
外链hrefer最全教程_第4页
外链hrefer最全教程_第5页
已阅读5页,还剩6页未读 继续免费阅读

下载本文档

版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领

文档简介

1、Hrefer界面Hrefer的设置项Convert all links to index. 把收获的链接转变为首页链接(只支持论坛类型)Reject domains with level lower than 2.过滤二级以上的域名Check all links “200 OK” response (will work SLOWLY). 检测链接200 OK状态。会降低获取链接的速度Log founded hight-PR freehostings into the FreeBonus.txt. 记录高PR子域名,并且提供免费的hosting到FreeBonus.txt(在Hrefer根目录)

2、Enable filtering of duplicated links by hostnames. 程序运行时,过滤重复域名Enable filtering of duplicated links on loading links database. 开启程序时,过滤重复域名(每次开启都会进行)By hostnames and by entire URL. 按域名或者url Deep of parsing (pages). 限制Parse页面数Do not use additive words. 禁用“additional words”Disable filtering harvested

3、links by Sieve-filter. 禁用Sieve-filterQuery ordering. 搜索命令排列顺序New query for each search engine or Same queries for each search engine SE是新的请求 还是 同样的请求Auto resumption parsing after program starting. 自动开始Parsing delay. 不同SE之间的请求间隔时间Save query - URL into to filename_query.txt. 保存找到url的关键词到文本不管用哪个SE获取数据,

4、Hrefer中的Words和Additive Words都是必不可少的内容。Words 通过尽可能多的词,增加对SE的请求,来增加获得url的可能性Additive Words 特征词,一般为网站程序的特征代码(footprints)Words database界面通过“Create New!” 可以用来创建新的 Words database可以通过以下几种方式得到Words databse数据1. 词库 (可以轻易找到以下类型的words)Top 500 English wordsTop 2300 English words26,000 English words150,000 Englis

5、h words 2. 字典在google中搜素“English dictionary filetype:txt”。可以找到很多字典类的内容。3. 书籍网站上有很多电子书可以下载到。最好是找到txt格式的。例如,(很赞,可以直接免费下载txt格式的电子书)。接下来“Create New!” ,然后“Add words from text file” 把刚才的txt格式的电子书导进去。轻松获得大量的Words。可以到找些书籍,合并后再导入,这样一次就可以获得更多的Words。4. Google“Add words from Google” ,“Enter keyword”

6、,“Choose Language”该方法是抽取搜索页面中的单词Additive Words界面Additive Words 也是添加尽可能多的词下面来分析下Simple Machines这种类型的论坛。红色框出来的词,就可以认为是特征词。先来看看首页Welcome, Guest Please login or register Login with username General Category General Discussion Posts Topics Last post by Posts in Topics by Members Latest MemberView the mos

7、t recent posts on the forumrecent postsMore StatsUsers OnlineGuestsUsersUsers active in past 15 minutes Most Online Today Most Online Ever LoginForgot your passwordUsernamePasswordMinutes to stay logged in Always stay logged in Powered by SMFSMF 2006-2011Simple Machines LLC再来看看论坛分类页面Subject Started

8、by Replies Views Last post Jump toTopic you have posted in Normal Topic Hot TopicMore than 15 replies Very Hot Topic More than 25 replies Locked Topic Sticky Topic Poll还要看看发帖的页面Did you miss your activation email PagesAdministratorMemberNewbieLoggedpreviousnextAuthorPrintTopicReplyProfile页面也要找找Summar

9、y Name Posts PositionDate RegisteredLast ActiveICQAIMMSNYIMCurrent Status Picture/Text Gender AgeLocation Local Time Language SignatureShow the last posts of this person Show general statistics for this member这几个页面的urlindex.php/boardindex.php/topicindex.php?action=profileindex.php?action=registerind

10、ex.php?action=loginindex.php?action=help然后把以上找到的特征代码整理下,添加到“Additive words”,这样一个比较全面的SMF类型论坛的footprints就找到了。如果是需要其他语言的SMF呢?1. 以上找特征码的网站,直接在特定的语言去找。(不过语言不通是个不小的问题)2. Google翻译,这个强大的工具应该会想到吧?看图。Search Engines options & Filter界面SE:可以选择搜索引擎Sieve-filter:保存的链接必须与所填的数据匹配自带的没太大作用,可以试试下面的这些:topic.php?forum=ya

11、bb.cgi?board=yabb.pl?board=index.php?topic=index.php?board=posting.php?mode=ikonboard.cgi?s=viewtopic.php?topic_id=showflat.php?cat=newreply.php?s=showthread.php?postid=showtopic.php?threadid=viewthread.php?s=dcboard.cgi?az=forum_viewpost.asp?tid=newreply.php?do=viewtopic.phpshowthread.phpshowtopicf

12、orumdisplay.phpviewforum.phpshowforumhttp:/forum.http:/forums.http:/foro.http:/phorum/forum/forums/foro/phorum/Multithreading界面这里可以调节代理检测和获取链接的线程数。还有就是每个请求之间的暂停时间。Proxylist 界面Proxylist Optionns 界面URL to checker HTTP-proxy 和 URL to Checker SOCKS中的地址一定要修改成自己的地址,要不代理会无法使用。在Hrefer/proxyc目录下面,的list.txt文件下面是用来找到 proxy的地址。这里是重点,尽可能去找更多的list吧。获得proxy的一项方法:1. 买2. 创建自己的proxy li

温馨提示

  • 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
  • 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
  • 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
  • 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
  • 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
  • 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
  • 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

评论

0/150

提交评论