搜索资源列表
text_tfidf
- 文本相似度计算(tfidf),可用文本分类以及文本信息处理-Text Similarity Computing (tfidf), available for text classification and text information processing
PLSA
- PLSA 的Java实现,可以用于图像处理,文本分类,文本聚类等-code of PLSA in JAVA
CRF1-2
- CRF1.2,条件随机场软件包,很好用很流行的一个文本分类软件,可以用于自然 语言的处理,标签,分类,词性发现,用户只需要着重构造特征函数既可以,实验结果和应用表明crf要优于隐马尔科夫模型。实现环境为java语言。-CRF1.2, conditions package with the airport, very good very popular with a text classification software, can be used in natural language proc
POSTagger_Src
- 包含了词条及其词性标记,频度信息的词典 练语料的格式要求: 每个词以 / 分隔, / 后是该词的词性标记。词性标记后至少要有一个空格。一个句子的所有词必须在同一行中。击“开始词性标注”选取文本文件(一次可以选择多个)进行标注处理-Includes a term and its part of speech marks, the frequency of information and training Corpus dictionary format requirements: Each w
ictclas4j
- 基于词典的分词工具,用与对文本文件的分词-word parsing tools based on dictionary