搜索资源列表
xwrapelite.rar
- html页面在线抽取器的源代码,java编写,可实现在线自动抽取实体,Extractor online html page' s source code, java development, can be automatically extracted entities online
VIPS
- 基于视觉的web页面分割算法(vips)-VIPSa Vision-based Page Segmentation Algorithm
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅