搜索资源列表
文本聚类的文档.tar
- 文本聚类的文档-text of the document clustering
neucsp
- 很好的分词工具,能对文本进行分词,标注词性,是进行文本聚类不可或缺的工具
textcluster
- 文本聚类算法源码,包含tf.idf计算的实现,采用java语言编写-text cluster algorithm, including the computation of tf.idf ,written by Java
TDHCursorFactory
- 是一个使用Perl语言编写的一个开源文本挖掘的程序。其中涉及了众多文本挖掘的技术,如文本聚类、分词、索引,搜索引擎、字典等等。-Perl is a language to use an open source text mining process. Involving a large number of text mining technologies, such as text clustering, segmentation, indexing, search engines, dicti
Ncut
- 本文介绍了web文本聚类的流程,着重介绍了Normalized Cut谱聚类的原理和算法,提出以Minimum cut作为类内部的内聚强度作为衡量Normalized Cut的迭代停止条件