搜索资源列表
word-findANDcount
- 这是一个原创的文章信息自动标引和分类小程序。可以用于文本分析。功能还在不断完善中:)-This is an original article automatic indexing and classification of small programs. Text analysis can be used. Capabilities are also constantly perfected :)
IdionLink
- 一个成语接龙的PERL程序,由电脑自动出成语,然后用户根据成语的最后一个字进行接龙,如接不上,可选择由电脑给出-an idiom of PERL procedures out automatically by a computer idiom, Then users under the idiom of the final Solitaire for a word, such as whether or not, given the option of having a computer
Paoding
- 中文分词得小系统,基本功能已实现,但还有很多地方有待改进,没有实现自动学习,人名识别等功能。-Chinese word in the smaller system, the basic functions have been achieved, but there is much room for improvement, no automatic learning, name identification, and other functions.
txt2img
- 在制作网页时,将文本段自动变化成图片的工具。在php的基础功能基础上笔记实现了自动换行,高度自动设置,右标点不放在行首等功能,特别对汉字做了优化处理。 该文件使用unicode编码,如果用其他编码,其中汉字需要修改。 请参见: http://arl.mae.cuhk.edu.hk/-the production of the website, will automatically change the text of the pictures into a tool. P
zidongfenci3.0
- 这个是我们的中文信息处理的作业,我是用mfc结合sqlserver写的,可以自己一步一步的进行分词,并且可以对文本进行分词,还可以自己的找到其中的歧义字段,并自动保存到文件
FontGen2
- 点阵字体产生工具以及相关显示函数。 在开发嵌入式系统时,需要显示不同大小或类型字体的汉字。显然,对于嵌入式系统,不太可能使用矢量字体,而点阵字体,不同大小的字体不能简单的缩放。 另外,对一个小系统,也不需要完整的字体,往往只要几十个,甚至几个就够了。 一般,我们采用的方法是,自己准备点阵字体的数据,在显示汉字时,把这些数据写入显存就行了。 这时又存在另外一个问题,由于是不完整的字库,不能简单的用汉字的内码去找到对应的字体数据,如果逐个比较,又费时间。比较好的方法就是把字体数据
hqbjdz
- 非常好用的自动获取本机ip地址的程序,是VB编的,可以免费下载
xqdj
- 人代会人员名单,使用EXCEL VBA编写,实现了自动按楼群等自定义方式分解、打印功能,效率很高。
UseLog
- 试某些程序的时候需要一个轻量级的日志文件作记录,这里给出一个简单易用的CLog类来完成此项功能。在编译应用程序的release版时,日志文件功能自动无效。
wbx
- 一组处理五笔输入法码表文件的小程序 chpy.c 将中文字符串自动转换成拼音的形式. 将中文的文件名转换成拼音的文件名- PY_FILE为WIN95全拼输入法反转换生成的拼音编码文件 delsingle.c 删除包含单个汉字的行 gb2312.c 生成所有GB2312码汉字 genwbsig.c 生成所有GB2312码汉字的五笔编码 py.c 去除imegen反编译后的TXT文件中词的编码,只剩下字的编码 wbadd.c 在已经存在的五笔编码文件中加入新增词组, 五
auto-grid-excel
- 自己设计的表格自动生成器,包括执行文件和源码,可以按照需求自行更改。
kMean
- k-mean算法演示,利用手工输入点通过k类自动聚合
winsvm
- 用支持向量机(svm)实现文本的自动分类系统。
hzpysm
- 汉字拼音首码,用vb编写的,自动找汉字的首字母,应用于检索
autosplit
- 中文自动分类分词程序,已经打包成dll,里面有说明
CharConvert
- 编码自动转化工具,能实现将文件由UTF8-GBK的转化。
webcollector2
- 本程序是专门用于从网页上自动收集cmi,cnki上的被引文献的数据,保存在本地的access数据库中。
自动分词与词性标注评测有助于学习NLP
- 自动分词与词性标注评测有助于学习NLP,并且理解其更深的含义,A good Instruction of PoS
ChineseWordSeg
- 采用最大概率法的中文自动分词软件,分词准确率达到70 以上。-Maximum probability method of Chinese word segmentation software, word accuracy rate of 70 .
text_category
- 中文自动分类。使用spider抓取网络信息,利用lucene的分词及KNN方法。-Chinese automatic classification. The use of spider crawl network information, the use of Lucene sub-word and KNN methods.