搜索资源列表
43545TheDesignandImplementationofChineseSearchEngi
- 中文搜索引擎的设计与实现.rar 华中科技大学硕士学位论文 A Thesis Submitted in Partial Fulfillment of the Requirements for the Degree of Master of Engineering The Design and Implementation of Chinese Search Engine 搜索引擎是 Web 信息检索的主要工具,Crawler 是搜索引擎的核心组件,用于 搜集 Web 页面
jocws500
- 可以帮助建立网站的搜索目录,能够高速建立目标URL数据库,提取超过70亿网页、目录及搜索引擎中的metadata(标题,关键字,描述)信息,并和用户的关键词作匹配 -can help establish a web site's search directory, a high-speed target URL database, Extraction of more than 7 billion web pages, directory and search engine
Deepthroat-php-2-3
- 深喉咙(Deepthroat) 可同时生成企业网站的前台和后台,并实现前后台同步管理。 基于PHP技术开发,系统构架安全合理,独特的缓存处理机制,使生成网站的浏览速度极快,结合Web设计简单理念,使生成的后台管理界面直观操作简单,支持插件模块、支持模版皮肤,使系统具有良好的扩充性,升级方便。 Deepthroat v2.2 (2006.10.13) 更新功能如下: · 增强SEO(搜索引擎优化) · 支持插件模块 · 支持模版皮肤 · 自定频
SogouW.20061127
- 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 ADV 副词 CLAS 量词 ECHO 拟声词
luke-src-0.7
- Lucene is an Open Source, mature and high-performance Java search engine. It is highly flexible, and scalable from hundreds to millions of documents. Luke is a handy development and diagnostic tool, which accesses already existing Lucene indexes
nlucene-1.2b2
- NLucene is the .NET implementation of the Lucene high-performance, full-featured text search engine written in Java.
BlueSearch
- 搜索数据取自百度网站,可实现站内搜索和互联网搜索,速度超快.-The data of searching comes from www.baidu.com. The software can search not only the site,but the internet.And the speed is quit high!
kua_souV0.1
- 夸搜高仿百度搜索引擎源码(带蜘蛛和竞价排名系统)V0.1.rar-Quarry search engine Baidu search high imitation source (with the spider and the bidding system) V0.1.rar
Professional_SEO_with_PHP
- 搜索引擎优化高级编程(PHP版),讲述如何使用php技术来构建一个搜索引擎并实施优化。-Search engine optimization high-level programming (PHP version), about how to use technology to build a php search engine optimization and implementation.
clucene-core-0.9.21b
- CLucene是C++版的全文检索引擎,完全移植于Lucene,采用 STL 编写。-CLucene is a C++ port of Lucene: the high-performance, full-featured text search engine written in Java. CLucene is faster than lucene as it is written in C++.
AnalyzerViewer_source
- Lucene.Net is a high performance Information Retrieval (IR) library, also known as a search engine library. Lucene.Net contains powerful APIs for creating full text indexes and implementing advanced and precise search technologies into your programs.
firtex-1.2.0_RC_src
- FirteX是一个功能强大、高性能、灵活的全文索引和检索平台。FirteX的主要目标是研究文本索引的快速构建(Index Construction),动态文档集的索引维护(Index Maintenance),短语查询(Phrase Query),Top-k查询的快速处理(Top-k Query Process)以及各种检索模型(IR Model)等。高性能和灵活的架构也使FirteX可以应用在产品搜索,桌面搜索,站内搜索,新闻搜索,Blog搜索,学术搜索以及大规模搜索引擎等领域中。-Firte
webCrawler
- 一种高性能分布式W eb Craw ler 的设计与实现-A high-performance distributed W eb Craw ler Design and Implementation
33753115ktdictseg_v1.0.01
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数-It s an arithmetc of word segment,it has a very high efficiency!
javaeiginwithgoogle
- 用jave和google搜索引擎实现的一个搜索引擎,具有非常高的借鉴价值。-Google search engine with jave and implemented a search engine, has a very high reference value.
totsearch
- 淘特站内搜索引擎(C#版)基于Lucene.Net核心,通过高效的中文分词算法将数据库中内容进行分析、索引并保存至硬盘中。前台搜索时,通过读取索引文件查询,避免了传统数据库查询在高并发及海量数据下的性能问题。因前台搜索不在连接数据库,为不希望数据库放到前台的特殊用户群体提供了数据快速查询解决方案-Amoy Special Search Engine (C# Edition) Based on Lucene.Net core, through the effective Chinese word
google_suggest
- 搜索提示仿google suggest提示效果。高度模仿速度快。-Search Tips imitation google suggest prompt results. A high degree of imitation of speed.
1
- 中文分词在中文信息处理中是最最基础的,无论机器翻译亦或信息检索还是其他相关应用,如果涉及中文,都离不开中文分词,因此中文分词具有极高的地位。中文分词入门最简单应该是最大匹配法了-Chinese word segmentation in Chinese information processing is the most basic, whether in machine translation Yihuo information retrieval, or other related appli
Search
- 搜索算法: 利用计算机的高性能来有目的的穷举一个问题的部分或所有的可能情况,从而求出问题的解 的一种方法。 搜索过程实际上是根据初始条件和扩展规则构造一棵解答树并寻找符合目标状态的节点的过程。 -Search algorithm: the use of high-performance computers to have the purpose of an issue of exhaustion of some or all of the possible, and thus obt
MetaSeeker-4.11.2
- 主要应用领域: • 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量采集,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 • 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地 采集内容,输出富含语义元数据的XML格式的抓取结果文件,确保自动化