搜索资源列表
SPIDER
- 网络爬虫,有简易的图形界面,用于抓取网页-nerwork crawler
HeritrixInstallation
- 一份Heritrix的安装文档,对初学爬虫的人很有帮助-Heritrix installation of a document, the person on the beginner reptiles helpful
metastudio_Linux_gcc_gecko1.8_zh
- MetaSeeker工具包V3是GooSeeker团队自主开发的网页抓取/数据抽取/信息提取软件,经历了垂直搜索、SNS等多个互联网浪潮的实战检验,已经发展到V3版本,并且分成企业版和在线版,对于不愿支付昂贵的企业版费用的用户可以免费下载使用在线版。 MetaSeeker工具包V3版本包括如下软件工具: 1,MetaStudio,网页数据结构定义工具,通过图形界面免编程定义网站数据抓取规则 2,DataScraper,数据抽取工具,能够连续大批量抓取网页内容,不是普通的网络爬虫,而是适应力-Me
GetMailsBySpiders
- 一个关于图形化界面的网页爬虫程序,在图形化界面中输入含有邮箱的网页,可以利用该小程序获取邮箱地址;-A web crawlers about graphical interface, input contains email page in the graphical interface, can use the applet access email address