搜索资源列表
zhishifencisuanfa
- 基于知识分词算法的病案全文检索系统, 硕士论文.-Knowledge-based segmentation algorithm cases full-text retrieval system, a master s thesis.
1
- 利用句型模板构造抽取规则,然后直接从经过时 间短语和空间短语识别和规范化处理的文本中抽取事件信息,从而跳过了深层句法分析,降低了实现系统的 难度 (2) 利用事件的规范化的时空信息关联不同文档中的同一事件,进行事件合并 (3) 文档发生事件转移时 对文档进行事件切分,从而解决了文档内不同事件信息的归并问题。-Extraction rules using sentence patterns, and then directly from the space of time phrase
text-based-segmentation
- text based segmentaiuon
image
- 本文在众多图像分割方法中选择了研究比较早的边缘检测方法来实现图像的分割,并且比较了各种边缘检测算子的检测效果。-This text choose EdgeDetection method that is a study early for image segmentation to carry out Detection image, and compare every kind of edge detection technique.
design-documents
- 网页信息采集子系统: 网页采集:动态查找及实时分析新增网页,读取网页回帖信息。 网页过滤:,对获取的网页,通过网页清洗模块清除网页中的广告、导航信息、 图片、版权说明等噪声数据,萃取出相关网页的标题、正文、链接地址、采集时 间、回帖、发帖人数等数据。 网页信息预处理子系统: 网页审查脏字:主要功能包括中文分词、词性标注、命名实体识别、新词识别, 建立数据库说明每类词库,建立敏感词词库。 网页舆情监测:监测是否出现了一定影响的*,即回帖的回帖或支持、顶等 达到
FULLTEXT01
- CBIR-Two novel contributions to Content Based Image Retrieval are presented and discussed. The fi rst is a search engine for font recognition. The intended usage is the search in very large font databases. The input to the search engine is a
Content-based-Image-Retrieval
- Two novel contributions to Content Based Image Retrieval are presented and discussed. The fi rst is a search engine for font recognition. The intended usage is the search in very large font databases. The input to the search engine is an i
lucenepds
- lucene全文搜索:实现了分词 索引 查找三大核心模块-lucene text search: the segmentation index to find the three core modules
search
- 统一资源定位符(URL)是网站页面的地址判别方式,也是蜘蛛抓取网站网页信息的途径。那搜索引擎蜘蛛是如何通过URL链接抓取网站页面的呢?搜索引擎工作大致分为三个阶段:爬行和抓取阶段(搜索引擎蜘蛛访问页面,并获取页面html代码存入数据库):预处理(对页面文字进行提取、分词、消除噪音、去重 和建立索引);排名(根据页面的相关性和网站权重高低展示给用户)。-Uniform Resource Locator (URL) address discrimination is the way web page