搜索资源列表
fenci
- 复旦的中文分词java程序包,装了eclipse话,导入项目就能用-Fudan University Chinese word java program package installed eclipse, then import the project will be able to use
ikTest
- 该程序主要功能:使用ik分词器对文本进行分词-segmention with ik Analyzer
ICTCLAS_Demo
- 该程序用于短信过滤分析,首先使用ICTCLAS分词系统对输入短信进行分词,接着使用贝叶斯算法分析训练模型。最后对测试集中的短信进行垃圾短信预测。由于短信涉及个人隐私,使用时请自行添加训练数据集和测试数据集-The procedures used for SMS filtering analysis, the first to use the segmentation the ICTCLAS segmentation system input SMS, then use a Bayesian al
MapTest
- 倒排索引,此程序,运用ICTClas分词工具实现的中文分词,并建立倒排索引输出到指定文件。-Inverted index, this procedure, use ICTClas segmentation tool to achieve the Chinese word segmentation and indexing inverted output to the specified file.
Segmenter
- 本程序用于对大批量的文本数据进行分词,分词的结果很好,同时能过滤掉不必要的听用词-This procedure is used to large quantities of text data sub-word, the word is very good, while filtering out unwanted listen wording
MyPaodingTest
- 一个中文分词 庖丁的测试程序 仅供初学者参考-paoding Test project
Split
- Java实现逆向最大匹配中文分词算法,本程序可以实现较为简单的中文分词-Java implementation reverse maximum matching Chinese word segmentation algorithm, the program can be implemented relatively simple Chinese word segmentation
Compute.java
- JAVA实现的统计tf-idf的程序,自写主类调用,提供了的接口,输入的文件应是分好词的文件-JAVA achieve statistical tf-idf program, self-write master class calls, providing file interfaces, input should be divided into many word documents
CifaAnalyse
- 编译原理课程相关——词法分析器的实现 能够对给出的C语言程序进行分词处理-Compiler Principle- lexical analyzer
NlpAnalysiTest
- 自然语言处理中,最基础的分词测试程序,采用CRF模型-Natural language processing, the most basic word test program, using CRF model
TestFenci
- java分词测试程序,调用开源分词工具ansj测试代码,效果可以-java segement source code open source ansj
java
- 程序为提取文章关键词的java程序,可以制定关键词和分词算法,可直接使用(Java program for extracting key words)