搜索资源列表
-
0下载:
自己编写的中文分词源程序,用vc++编写,附有完整的文档,以及标准的分词数据库,I have written the source code of the Chinese word segmentation, using vc++ to prepare, with complete documentation, as well as sub-standard speech database
-
-
0下载:
中科院中文分词程序ICTCLAS的汉语词性标记集,Chinese word segmentation procedure, Chinese Academy of Sciences of the Chinese part of speech tag ICTCLAS Set
-
-
0下载:
计算所汉语词法分析系统ICTCLAS.分词正确率高达97.58 (973专家组评测),未登录词识别召回率均高于90 ,其中中国人名的识别召回率接近98 处理速度为31.5Kbytes/s。ICTCLAS的特色还在于:可以根据需要输出多个高概率结果,有多种输出格式,支持北大词性标注集,973专家组给出的词性标注集合。这是最新版的API接口文档,有详细的示例。-Calculation of the Chinese lexical analysis system ICTCLAS. Segmentati
-
-
0下载:
通过一个已经标号词性的训练集来得到训练数据,再根据训练数据对需要进行分词的数据进行分词,采用概率最高的分词情况为最后结果。-By a label the parts of speech training set training data to get the need segmentation data based on the training data segmentation with the highest probability of segmentation for the fin
-
-
0下载:
中文分词和词性分析通用的训练集,含POS。-Chinese word segmentation and part of speech analysis of generic training set.
-
-
0下载:
PFR人民日报标注语料库(版本1.0,下面简称PFR语料库)是在得到人民日报社新闻信息中心许可的条件下,以1998年人民日报语料为对象,由北京大学计算语言学研究所和富士通研究开发中心有限公司共同制作的标注语料库。为了促进中文信息处理研究的发展,我们三方计划公开PFR语料库。作为公开的前期工作,从4月3日起,在我们三方的主页上免费公开PFR语料库1月份的语料,欢迎大家下载。PFR语料库的制作规范参阅《现代汉语语料库加工――词语切分与词性标注规范》。如果您在研究或论文工作中使用PFR语料库,请注明来
-