搜索资源列表
多种分词方法
- 含有多个分词算法。毕业设计的时候获得的,希望对大家在汉字处理中能用的到。 ICTCLAS算法,中科院,对名字识别能力很强。VC开发。 CSharp分词,向前匹配加向后最大匹配,C#开发,容易扩展。 小叮咚分词,由后向前最大匹配,C#开发。 xerdoc分词,基于ICTCLAS的Java版本分词。 文本分词词典,分词的词典,可以提供分词数据源。-containing more than Segmentation. Graduation was the time of hope
Xerdoc XDMF
- 一个比较好用的中文分词模块,是车东等人开发的,比较有名,java语言实现-a better quality of the Chinese word module, East cars were developed, more famous, java language!
word_segment
- 基于Java的全文文本檢測與分割 (word segmentation)-Java-based version of the transcr ipt detection and segmentation (word segmentation)
神经网络算法
- JAVA版的BP神经网络源代码,源代码是Word形式,若拷贝到项目中可直接运行。
nlu_project
- 采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。本系统使用java语言编写-Using machine learning methods for natural language processing, carried out on the Chinese word segmentation and POS tagging. Segmentation using crf model, tagging with
java_stopword_code
- Java 数据挖掘进行文本预处理的一步,除去文本中包含的停用词-Java Data Mining for text preprocessing step to remove the text contains the word disabled
sckr2013_final
- 基于Word2vec的词语相似度计算,包含完整的java代码,但语料由Word2vec训练得到的模型太大,故不附带模型。-Word2vec-based word similarity computation, including complete java code, but by the Word2vec training corpus resulting model is too large, it is not included with model.
IKAnalyzer
- JAVA实现简单客服的机器人系统,分词用系统用IK分词,机器人语言用AIML。程序已经实现java socket服务的建立。实现了中文分词,同义词输出,答案匹配。用到的库有IK、program-ab。搞了一个月的小成果,希望大家能用到。-JAVA simple customer service robotic systems, word by word IK systems, robot language with AIML. Procedures have been implemented t
Preprocessing-Java
- 自然语言处理,对于分词后的结果预处理,提取分词结果中的中心词和短语-Word and phrase extraction and segmentation results