搜索资源列表
yuer
- 前几天因为好久没发blog了,就拿我毕设中的一段算法凑数,没想到引起很多人的兴趣。因此就把我的分词算法单独拎出来做了一个项目叫作DartSplitter。暂时把分词算法的名称叫做树状词库分词法。 -days ago had not issued because of the blog, I took the completed section based algorithm to make up the numbers. never thought aroused the intere
TreeCutWord
- 一套分词算法. 也是我的毕业设计的原型. 该分词算法,使分词速度达到2~8万/秒.而且没有使用线程.如果使用线程,速度可达几十万每秒以上
zhongwenfenci
- 讲述面向信息检索的中文分词程序的PDF文档,
zhongwenzidongfenciyanjiu
- 关于中文分词算法基本研究的介绍,综合的介绍了中文自动分词的原理及一般算法。
基于自动分词的企业文档搜索引擎设计与实现
- 一个关于基于自动分词的企业文档搜索引擎设计与实现的优秀论文
多种分词方法
- 含有多种常用分词方法 ,中科院,小叮当......
中文分词技术及最新发展
- 搜索引擎通常由信息收集和信息检索两部分组成。对于英文,由于英文中词 与词之间是用空格隔开,检索起来很方便,故计算机采用了词处理的方式,大大 减轻了用户与计算机的工作量:相对来讲,中文的情形就复杂得多。中文的词与 词之间是没有分隔符的,因此若想建立基于词的索引,就需要专门的技术,这种 技术被称之为“汉语词语切分技术”。根据是否采用词语切分技术,中文搜索引 擎又可分为基于字的搜索引擎和基于词的搜索引擎。由于中文信息处理的特殊 性,开发中文搜索引擎决不像西文软件的汉化那样简单。在实
百度分词算法分析
- 百度分词算法
中文分词技术文档
- 中文分词技术的相关文档
中文分词
- 搜索引擎中文分词
ICTCLAS2009.对中文进行分词并对其词性标注
- 对中文进行分词并对其词性标注;命名实体识别;新词识别;同时支持用户词典,To be conducted in Chinese word segmentation and POS tagging Named Entity Recognition new word identification simultaneously support the user dictionary
汉语自动分词与词性标注软件中文分词系统
- 学习汉语自动分词与词性标注软件的组件化有助于更好的理解中文分词系统,PoS tagging HMM
Lucene
- 在网上找到的一本全面介绍lucene分词功能书。很不错!-a book named lucene in action
zhishifencisuanfa
- 基于知识分词算法的病案全文检索系统, 硕士论文.-Knowledge-based segmentation algorithm cases full-text retrieval system, a master s thesis.
fenci_suanfa
- 分词算法,很强大
ZuiDaPiPeiSuanFa
- 对一个字符串进行最大匹配法分词的算法,在VC环境下运行即可。-A string of maximum matching word segmentation algorithm can be run in the VC environment.
ICTCLAS
- ICTCLAS分词,来自中科院的分词器,可以提取指纹的等功能-ICTCLAS
gugeheibanbaoshuxuezhimei
- 分多个系列详细介绍了数学的应用,如统计语言模型,中文分词,隐含马尔科夫模型在语言处理中的应用等等非常经典的例子,让我们更深入学习了解数学的光芒所在-Described in detail in several series of mathematical applications, such as statistical language model, Chinese word segmentation, hidden Markov model of language processing an
ICTCLAS 中科院分词工具
- ICTCLAS是中科院的中文分词工具,是目前国内最好的中文分词工具。进行文本分析的必备工具
icwb2-data
- 中文分词数据,含有as、 cityu、msr、pku数据,包括测试集、训练集(Chinese word segmentation data)