搜索资源列表
spider1.20PforPwindows
- 微博爬虫连接数据库爬去新浪博客用户数据 配置数据库 1.00 测试版 正常运行 爬虫 新浪博客 3.5 或 4版本 添加图片下载通道开关 -Microblogging reptiles crawled Sina blog users connect to the database data Configuration Database 1.00 beta running reptile Sina blog version 3.5 or 4 channel switch to ad
Lucene+Nutch
- 该书首先描述了开发平台的配置, 接着详细介绍LUCENE和NUTCH开发。-The book first describes the development platform configuration, and then details the development of Lucene and NUTCH.
MySo
- 例子以拍拍网为例下载网页,最大线程1024,但是要比较好的网络条件下,机器配置比较高才不会处问题哦,在服务器上测试效果很好。-Patted network example to download page as an example, the biggest thread 1024, but relatively good network conditions, the machine configuration will not compare Gao Cai Department issue
risearch
- RiSearch PHP是一个高效,功能强大的搜索引擎,特别适用于中小型网站。RiSearch PHP非常快,它能够在不到1秒钟内搜索5000-10000个页面。RiSearch是一个索引搜索引擎,这就意味着它先将你的网站做索引并建立一个数据库来存储你网站所有页面的关键词以便快速搜索。Risearch是全文搜索引擎脚本,它把所有的关键词都编成一个文档索引除了配置文件里面的定义排除的关键词。 RiSearch使用经典的反向索引算法(与大型的搜索引擎相同),这就是为什么它会比其它搜索引擎快的原因。
NetBoverticalsearchengine
- 网博垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合; 4.最新新闻系统已增加伪静态与全站生成静态功能。 5.后台地址:htt://xxx/admin/login.aspx,后台用户名:webhww 密码:http://s.webabc.com.cn/-Net Bo vertical
chuizhisearch
- wangbo垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合;-wangbo vertical search engine that fully open-source version of one. front with Lucene search engine capabilities, all
staticPageDemo
- 如何增强你网站中地址的可读性和让搜索引擎快速的收录到你的站点,这就需要你美化你的网页的地址,也就是我们常说的Url 重写技术,大家熟悉的可能有很多服务器都提供Url重写的技术,以前我们用的最多的就是Apache,Jboss这样一些服务器自带的一些Url重写,但是他们的配置比较麻烦,性能又不是太好,现在我们有专一的开源框架来完成Url重写任务,今天我要介绍的就是UrlRewriter-How to enhance the readability of your website address an
larbin-2.6.3
- 一个高效的网络爬虫,可以自行修改配置文件,为linux下工作环境,很具有参考意义-An efficient Web crawler that can modify configuration files for linux work environment, it is a reference value
SearchEngine
- 这是一套拿去就能用的Java毕业论文资料,内含JAVA技术实现搜索引擎的源代码、技术文档、编译JAR文件,如果你想偷懒的话,拿去就能用了。尤其是作者的文档写的很有水平,足以看出下了一番功夫,源代码也比较完整,不过环境配置比较麻烦。-This is a set of Java with the thesis will be able to take information technology to achieve search engine contains the JAVA source co
video
- 做为独立主机的用户有开发基础的程序员,按照以下步骤操作: 做为独立主机的用户,您可以直接让托管商为您打的服务器系统和配置。所需软件提供如下:win2008 操作系统IIS、mysql 5.1.5.8[或最新版]、framework3.5 。 安装只需要4步。首先将 1、建立视频索引库:在大空间的盘符下建立:视频搜索/index 【索引库】如:F:/ 视频搜索/index 2、安装分词服务系统fenciserver3.1 双击: 安装分词服务器.bat 安装即可,然后点击:fenc
webdownload
- win7下使用libcurl配置的网页下载程序,vs下要先配置好libcurl-win7 use libcurl configuration pages download programs, vs first configured libcurl
domainSpider
- 自己用java写的一个域名扫描程序,扫描网络上未被注册的域名。可以在配置文件里配置字符组成、长度范围、域名机构名。扫描结果存放mysql数据库里同时输出log文件,建库语句压缩包里有。-Own a domain name written in java scanner scans the network is not registered on the domain name. Configuration characters in the configuration file, the len
crawler-on-news-topic-with-samples
- java做的抓取sohu所有的新闻;可以实现对指定站点新闻内容的获取;利用htmlparser爬虫工具抓取门户网站上新闻,代码实现了网易、搜狐、新浪网上的新闻抓取;如果不修改配置是抓取新浪科技的内容,修改配置可以抓取指定的网站;实现对指定站点新闻内容的获取-java do crawl sohu news access to the designated site news content using htmlparser reptiles tools crawl news portal, c
word
- 文档详细说明solr的安装环境和安装部署,以及solr的定时任务配置。(The document details the installation environment and installation and deployment of Solr, and the timing task configuration of solr.)