搜索资源列表
webmagic-master
- 一个爬虫框架,除了不会反爬虫外(当然可以自己加)其他都很牛逼,用java写的。-A crawler frame, besides will not reverse the crawler themselves are added (of course) other are very cow force, written in Java.
webmagic
- webmagic是一个无需配置便于二次开发的爬虫框架,它提供简单灵活的API,只需要少量代码即可实现一个爬虫-Is a configuration without the need to facilitate the development of the two crawler framework, which provides a simple and flexible API, only a small amount of code to achieve a crawler
SpringBoot_Magic
- 基于springboot的java爬虫,服务器使用mysql。全注解方式。拓展性强。(Java crawler based on springboot)
WebMagic
- 爬虫小样例,去爬取豆瓣的数据并保存,需要jdk1.7(a demo of Crawler,Climb the data of douban and save it,need jdk 1.7.Research and Implementation of Distributed and Multi-topic Web Crawler System)
源码_俞育峰
- 知识库管理系统,包含源码和数据库。通过maven构建,使用git版本控制和团队合作,采用springmvc+mybatis框架,集成Lucene全文检索,openoffice转化office文档,ffmpeg处理视频文件,red5搭建流媒体服务,基于pageRank、TF-IDF算法提取处理知识点,webmagic爬取数据,itextpdf、poi处理office等。(knowledge base manage,resource and oracle. maven building)
webmagic深度加载
- webmagic 爬虫代码,webmagic 爬虫代码webmagic 爬虫代码
知识管理系统
- 知识库管理系统,包含源码和数据库。通过maven构建,使用git版本控制和团队合作,采用springmvc+mybatis框架,集成Lucene全文检索,openoffice转化office文档,ffmpeg处理视频文件,red5搭建流媒体服务,基于pageRank、TF-IDF算法提取处理知识点,webmagic爬取数据,itextpdf、poi处理office等。