搜索资源列表
取汉字区位码C#
- 取汉字区位码C#-from Chinese regional code C#
FixHalfChinese
- 一个朋友为从UNIX上传递尾部带半个汉字的xml脚本,导至系统异常,困扰了至少半年之久。所以用VC++作了一个演示,解决了这个跨平台的,不大不小的难题。-from a friend to pass on UNIX with half a tail of the Chinese characters xml scr ipt, lead to a system anomaly, beset at least six months long. Therefore, the use of VC made
classifier-1.12
- 能对从Google中搜索出来的文本进行聚类,提供了Java包,及调用源代码.-can right from the Google Search for the text clustering, a Java package, source code and call.
CheckNum
- 从预料中抽取汉字数字变成英文数字(作信息抽取用)-taken from the expected number of Chinese characters into English figures (used for information extraction)
SpellChecker
- 这是一个取中文拼音首字的DOTNET控件-This is a first from the Chinese phonetic characters DOTNET Controls
cnreader_fix4.12src
- psp上的reader 这个是以月光老大的cnreader为基础 增加了zip文件浏览功能,象浏览目录一样浏览zip文件。 zip内部的中文文件名可以正常显示 修正了原版的cnreader不能显示中文路径名的问题(同处理中文文件名一样处理)。 我只有1.5的,所以1.0没有测试过。 zlib用的是网上流行的版本,可能是1.2.2版,这个版本已经确认了有一些安全问题,稍候后我会研究一下最新1.2.3版本。 我这样做的原因是现在rip过的game都是正好
MySeg
- 最短路径法分词程序。将中文句子经过原子切分后生成一个有向无环图,然后使用Dijkstra算法求出由起点到终点的最短路径以实现中文分词。-shortest path method participle procedures. Chinese Sentence will be read after splitting atoms generated a directed acyclic graph. then use the Dijkstra algorithm derived from the s
5271615762
- 中文分词技术 从别的网上摘的 感觉还不错 请大家-Chinese word technology from other online pick feeling quite well please try
TestCorpusyuliaoguanli
- 1. 这是一个简单的语料库管理系统 2. 可以添加和删除语料文件,统计语料中的字数 3. 可以查找语料中的汉字串以及重叠形式 4. 语料文件存放在corpus目录下,查询结果保存在跟语料库相同目录下 5. corpus目录下有4个文本文件(其中test1, test2是两个小文件)供测试用 6. 只能处理文本文件,GB内码-1. This is a simple Corpus management system 2. They can add and delete corpu
html2txt
- 从html文件提取可显示的文本内容。可用于windows和linux环境。-from html document can show that the extraction of text. Available for Windows and Linux environment.
takechar
- Takechar 可以从不同种类的源代码中取出中文字符.它对于嵌入式设备的小字体开发非常有帮助. -Takechar from different types of source code out of Chinese characters. It has embedded equipment Development of the small print very helpful.
simmetrics_src_v1_5_d06_06_06
- SimMetrics is a Similarity Metric Library, e.g. from edit distance s (Levenshtein, Gotoh, Jaro etc) to other metrics, (e.g Soundex, Chapman). Work provided by UK Sheffield University funded by (AKT) an IRC sponsored by EPSRC, grant number GR/N15764/0
314962354
- 整理资料时发现了大一时C程序设计的大作业,是一个简单的联系人管理系统,有一千多行代码吗,界面布局和菜单风格都是仿照 Turbo C 做的。 在C中表现图形界面是一件很痛苦的事情,于是就做了一个折中的选择,这个程序中的“图形界面”实际上是使用字符模仿的,但工程量仍然不小,大概有一半左右的代码花在了界面的描绘上。 程序的注释非常详细,现在看起来也一点不吃力,结构也比较清晰,界面和功能基本上是分开的,扩充和修改都很容易。对于C语言的初学者来说,应该是一个不错的范例,认真看一看肯定会
salarymanagement000
- 工资管理--源代码及关键源代码.实现了用户名的输入,工资的输入和工资的变更等操作。-wages -- the key source code and the source code. Implementation of the input from users, The importation of wage and salary changes, the operation.
TS300Src
- 从唐诗300首中统计作者和发表的诗篇,用perl语言实现-from the Tang Dynasty 300 Statistics published by the author and poetry, using perl language
Pos_py
- 采用复杂数据结构从文件中生成一个带有拼音和词性信息的词典,用perl语言实现-use of complex data structures generated from the paper with a phonetics and POS information in the dictionary. using perl language
Oasis(Beta)
- 解码器是基于短语的统计机器翻译系统的核心模块,本解码器是“丝路”1.0 版(SilkRoad V1.0)中由哈尔滨工业大学开发的“绿洲Oasis”解码器。研究统计机器翻译的研究者必备。-decoder is based on the weight of statistical machine translation system's core module, The decoder is the "Silk Road", Version 1.0 (V1.0 SilkR
CARAVAN
- 解码器是基于短语的统计机器翻译系统的核心模块,本解码器是“丝路”1.0 版(SilkRoad V1.0)中由厦门大学开发的“商队Caravan”解码器。研究统计机器翻译的研究者必备。-decoder is based on the weight of statistical machine translation system's core module, The decoder is the "Silk Road", Version 1.0 (V1.0 SilkRo
16LCDHANZICODE
- 根据汉字编码,从16*16汉字库读出二进制点阵,并转换成LCD液晶显示的二进制码-under the Chinese character coding, from the 16 * 16 Store read binary lattice, and the conversion of LCD binary code
汉字显示TC20
- 在西文环境中用c语言从字库中读取并显示汉字的源码-in Western environment using C language from the library and reading the source code display Chinese characters