搜索资源列表
spider(java)
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-web crawling robots - known network (Robot), Web crawling,
GetWordInfo
- 本程序实现取词功能,可以获取指定的相关信息,包含示例程序。-program from the word function, the designated access to the relevant information, including sample program.
java
- BlogRank 通过获取其他搜索引擎的反向链接来评价Blog的热门程度
cjbt
- 1.BT下载页和种子列表以及搜索列表页均采用伪静态化URL,更易于被搜索引擎收录。 2.内置百度的热门电影、电视剧、动漫卡通、软件等TOP50关键字排行小偷. 3.强大的BT搜索功能. 4.可以在Linux和windows等系统服务器上正常运行。 5.除去了一些不必要的代码,提高了程序运行效率。 6.BT数据同步更新程序,每天更新几百条BT种子 7.任意自定义添加广告(请自行修改www文件夹下的文件) 8.高速获取数据,无需维护管理,一分钟即可建立个性化的BT站点!
incSpideraspnet
- 蜘蛛登陆追捕器 (网络版)0.12 版 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引擎收录的收录情况等等有相当重要的作用。
spider
- 网络蜘蛛Spider,实现了从网络的自动获取Url并保存。
heritrixProject
- 搜索引擎的一个分支,在搜索网页时首先得用一个爬虫来获取网址该代码的功能就是获取所需网址的
seeknove103
- Seeknove 1.0.2是一个用PHP开发的开源搜索引擎整合系统,可根据关键字获取多个搜索引擎的搜索结果。Seeknove有两种搜索模式:分类模式、引擎模式。分类模式是按照功能分类索引的搜索模式,目前的分类有:网页、图片、新闻、音乐、视频、博客、论坛、地图、词典、资源。引擎模式是按照搜索引擎索引的搜索模式,整合的搜索引擎有:Google、百度、Yahoo、搜狗、有道、中搜、Live、搜搜、爱问、奇虎。
heritrix2.rar
- Heritrix是一个爬虫框架,可加如入一些可互换的组件。 它的执行是递归进行的,主要有以下几步: 1。在预定的URI中选择一个。 2。获取URI 3。分析,归档结果 4。选择已经发现的感兴趣的URI。加入预定队列。 5。标记已经处理过的URI ,Heritrix is a framework for reptiles, such as income may be a number of interchangeable components. It is a recursive implem
Web_Crawler.rar
- 网页爬行蜘蛛,抓取网页源码,用这个程序源码,可以编译实现自己的抓取网页源码已经获取网页所有的link,Web Crawler
neterresearch
- 实时获取搜索数据,采用ASP+XML技术,无需手动-Real-time access to search data using ASP+ XML technology, no need to manually
Injectionvolumeaddresstheuseoftol
- 注入地址批量检测工具站长使用工具输入关键子——搜索——获取地址——批量检测 然后在左后个框中出现存在漏洞的页面 -Injection volume address the use of tools for detection of tool head input key sub- Search- Get address- bulk detection and then a box appears in the left page there are loopholes
Bseeknove
- Seeknove 1.0.3说明 作者:PXL(WWW.PXL.NAME) Mail:pxl@compxler.com http://www.seeknove.com 产品简介: Seeknove 1.0.3是一个用PHP开发的开源搜索引擎整合系统,可根据关键字获取多个搜索引擎的搜索结果。Seeknove有两种搜索模式:分类模式、引擎模式。分类模式是按照功能分类索引的搜索模式,目前的分类有:网页、图片、新闻、音乐、视频、博客、论坛、地图、词典、资源。引擎模式是按照搜索引
ss
- 网页抓取器又叫网络机器人(Robot)、网络爬行者、网络蜘蛛。网络机器人(Web Robot),也称网络蜘蛛(Spider),漫游者(Wanderer)和爬虫(Crawler),是指某个能以人类无法达到的速度不断重复执行某项任务的自动程序。他们能自动漫游与Web站点,在Web上按某种策略自动进行远程数据的检索和获取,并产生本地索引,产生本地数据库,提供查询接口,共搜索引擎调用。-asp
Robot
- 网上机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获取在Internet上的信息。机器人利用主页中的超文本链接遍历Web,通过URL引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HTML文件的验证、URL链接验证、获取更新信息、站点镜象等。 -Internet Robot (Robot) also known as Spider, Worm, or Random, the core objective is t
GetWebSource
- 检测网页中的连接,并获取其所在的语句,有利于网页内容检索,是网络爬虫的一部分-Detection of the page to connect, and access to their statements, in favor of Web content retrieval, is part of network of reptiles
winsocketftpsearch
- 基于winsock的FTP搜索程序,可以分析和获取指定ip段的ftp资源-Winsock the FTP-based search procedure, can be analyzed to obtain the specified ip and ftp resources section
zhizhu
- 一款蜘蛛程序,国外开源.适合二次开发.一个JAVA开发的简单网络爬虫 可以实现对指定站点新闻内容的获取 程序很简单 大家一起学习.-<!-- You may freely edit this file. See commented blocks below for --> - <!-- some examples of how to customize the build. --> - <!-- (If you delete it
zhizhu
- 网络爬虫,进行对网页中部分代码的获取,到数据库中-spider
seeknove-1.0.13
- Seeknove 1.0.8是一个用PHP开发的开源搜索引擎整合系统,可根据关键字获取多个搜索引擎的搜索结果。截止到1.0.8版搜索分类为:网页、图片、新闻、音乐、视频、博客、词典、源码、资源,整合的搜索引擎有:Google、Live、有道、搜狗、金山词霸、SourceForge、ChinaZ、btSeeker、VeryCD、飞客、天空软件、射手。-Seeknove 1.0.8 with PHP is an open source search engine developed integrat