搜索资源列表
TestCorpusyuliaoguanli
- 1. 这是一个简单的语料库管理系统 2. 可以添加和删除语料文件,统计语料中的字数 3. 可以查找语料中的汉字串以及重叠形式 4. 语料文件存放在corpus目录下,查询结果保存在跟语料库相同目录下 5. corpus目录下有4个文本文件(其中test1, test2是两个小文件)供测试用 6. 只能处理文本文件,GB内码-1. This is a simple Corpus management system 2. They can add and delete corpu
Win32Cut
- 分词程序,Win32窗口界面程序,含设计文档,具有打开文档,显示分词结果,保存结果等功能,欢迎讨论。- The participle procedure, the Win32 window contact surface procedure, contains the design documents, has opens the documents, demonstrated the participle result, preserves function and so on resu
wenben.txt
- 在一个文件中找到给定单词出现的位置并统计出现次数-documents in a given word to find the location and frequency statistics
duchushuju
- 直接读取Excel文件数据-Excel documents directly read data
8624_Big2gb
- 在简体字和繁体字间互相转换,并保存为文件,以便阅读.-in the simplified and traditional Chinese characters among interchangeable, and the preservation of documents to read.
gerenqiuzhiguanlixitong
- 好东西望管理员给本人多加几分!每个人上传个文件不容易!-good things, I hope more managers to say! Everyone upload documents is not easy! Thank you
eva.tar
- linux 下最好用的 QQ 客房端。支持传文件,传图片。与大家分享-linux under the best of QQ - Rooms. Support documents, Chuan Photo. Share with you
latex-powerpoint
- 用latex编辑适用于powerpoint格式的PDF文档。-using latex editor powerpoint format applies to the PDF documents.
xercescbucong
- 有网友上传了 文本分类的代码 Svmcls.rar ,应该加这个文件才可以完整编译通过。-Some Internet uploads the text classification code Svmcls.rar. should increase the integrity of documents can compile.
segment10_31
- 中文分词代码,对TXT文件进行分词,并组织分词结果-Chinese code word for TXT documents segmentation, and the organization of segmentation results
srcfileread_10_31
- 对文件进行操作,对索引倒排表中的文件进行相应的操作-the documents operation, the inverted index table of the corresponding documents to operate
ProtelDXP2004hanhuagongju
- 中文平台在PCB中放置字符串时选择SERF字体可显示中文但打印时乱码。 在PCB中打印中文可使用汉字PCBHZ补丁。 步骤: 1,安装中文平台; 2,将PCBHZ文件包放入Altium2004根目录; 3, 将DXP.RCS文件放入C:\\Documents and Settings\\个人文件夹\\Application Data\\Altium2004目录 4,重新启动DXP2004. 5,在PCB界面中加载PCBHZ文件包中的hanzi库文件;
gbk2unic
- 把一个gbk编码文件转化为unicode编码文件。-put a coding edit documents into unicode encoded files.
工作区整体,功能较多,转为UNICODE量身定做
- 专门处理UNICODE编码文件的工作区,功能还在继续扩充,小弟抠了很久的。-devoted UNICODE coding of documents, functions also continue to grow, the younger telling for a long time.
MS-LCID
- 多国语言规范,微软官方描述,非常有用的PDF文件-Multi-language specification, Microsoft' s official descr iption, a very useful PDF documents
chinese-text
- 文本分类语料库,经过编辑手工整理与分类的新闻语料与对应的分类信息。其分类体系包括几十个分类节点,网页规模约为十万篇文档-Text classification corpus, edited manually compiled and classification of news corpus and the corresponding classification information. Their classification system includes dozens of classi
FontSetConverter
- 对文件中的中文做编码转换,支持目录下所有文件的转换,转换格式为UTF8到GBK。-To document the Chinese to do encoding conversion, support for directory conversion of all documents, conversion to UTF8 format to GBK.
BlogClassify
- java实现xml文档分词 提取出文章的主题-xml documents java achieve segmentation to extract the theme of the article
segment
- 1 本程序说明了用概率法猜测“人名”的一般过程 2 用户可以修改config.ini文件中的值 3 用于测试的三个文件中: test1是小学语文课本语料 test2是按句分行的语料 test3是包含歧义串的语料-A descr iption of the procedures for using the probability method guess " names" the general course of 2 users can modify
speech
- 采用多线程方式朗读中文文档,需要语言库 -Using multi-threaded approach reading Chinese documents