搜索资源列表
SharpICTCLAS
- ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
linux-full-version
- LIUX作业FROM BUPT 1.find /tmp –user tom –mtime +60 | xargs rm -rfv 2.cat sample.txt | tr A-Z a-z |tr –cs a-z\’ ‘\n’ | sort | uniq –c | sort –nr | head -10-LIUX job FROM BUPT 1.find/tmp-user tom-mtime+60 | xargs rm-rfv 2.cat sample.txt | tr AZ
LINUX-HOMEWORK
- LIUX作业FROM BUPT 1.find /tmp –user tom –mtime +60 | xargs rm -rfv 2.cat sample.txt | tr A-Z a-z |tr –cs a-z\’ ‘\n’ | sort | uniq –c | sort –nr | head -10 6.adduser sambausr1 passwd sambausr1 adduser sambausr2 passwd sambausr2 addgroup sa