搜索资源列表
GetFileTimes
- 用java编写的tf*idf 结果输出txt文本,方便作后来的聚类矩阵
tct-070227
- 类似于Weka的文本聚类工具箱,可以读取Weka格式的文件,并实现了常用的文本聚类算法以及聚类集成算法,对于机器学习的朋友来说是个好东西
VSM
- 用TFIDF和特征增益两种方式实现了特征向量空间的建立,将文本文件表示成特征向量的形式,为接下来的聚类做了准备。程序用JAVA写成。
JAVA实现文本聚类,用到TF/IDF权重
- JAVA实现文本聚类,用到TF/IDF权重,用余弦夹角计算文本相似度,用k-means进行数据聚类等数学和统计 知识。,JAVA realization of text clustering, using TF/IDF weight, calculated using cosine angle between the text of similarity, using k-means clustering for data such as mathematical and statistical
java-cluster.zip
- 用java语言实现文本聚类,包括聚类前的数据预处理:分词、降维、建立向量空间模型等,Implementation using java language text clustering, including clustering of the data pre-processing before: segmentation, dimensionality reduction, set up, such as Vector Space Model
lingpipe-3.6.0
- 一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能,包括主题分类(Top Classification)、命名实体识别(Named Entity Recognition)、词性标注(Part-of Speech Tagging)、句题检测(Sentence Detection)、查询拼写检查(Query Spell Checking)、兴趣短语检测(Interseting Phrase Detection)、聚类(Clustering)、字符语言建模(Character
Clustering
- 用于文本的聚类,里面包含两个java文件,需放在同一个包内-For text clustering, which contains two java files, need to be placed within the same package
K-Means
- K_Means(java)算法的实现,有界面,灵活性强,交互性强。-K_Means (java) algorithm, there are interfaces, flexibility, and strong interaction.
textcluster
- java文本聚类程序代码文件,实现文本聚类功能,分词。-text clustering java code files to achieve text clustering features, sub-word.
kmeans
- java k均值源码,实现了k-means的算法,并给出界面显示。实例中通过二维空间中的点进行聚类。-java k-means algorithm, display the cluster result on the two demension.
k-means_Program
- k-means 算法接受输入量 k ;然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足:同一聚类中的对象相似度较高;而不同聚类中的对象相似度较小。聚类相似度是利用各聚类中对象的均值所获得一个“中心对象”(引力中心)来进行计算的。 -k-means algorithm to accept input k then n-k of data objects into a cluster in order to make the cluster available to meet: t
textcluster
- 文本聚类 预处理+KMeans的Java程序-Clustering preprocessing+ KMeans the Java program
MessageClustering
- 用java实现的应用了weka包的Kmeans方法的文本聚类程序。-a program written in java with simplekmeans in weka.jar.
TextClustering
- 文本聚类算法包含 tfidf的实现 k-means算法的实现-Text clustering algorithm contains tfidf implementation of the k-means algorithm to achieve
textcluster
- 基于KMeans的文本聚类算法,支持文本输入,简单易懂-KMeans clustering algorithm based on text, support for text input, easy to understand
textcluster
- 实现文本聚类,初级使用者可以作为参考进行文本聚类知识的辅助学习-The realization of text clustering, primary users can be used as reference for text clustering knowledge assisted learning
textcluster
- java版的k-means算法,实现文本聚类功能-the k-means algorithm in java
Large-scale-text-clustering-master
- java 实现文本聚类 java 实现文本聚类 -the code of text clustering the code of text clustering the code of text clustering
Kmeans-master
- 本程序使用java代码实现一个文本聚类操作,采用的方法是kmens-a simple code of text clustering using kmeans
Kmeans
- 算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现(Algorithm idea: extract the TF/IDF weight of the document, then calculate the distance between two multidimensional vectors by cosine theorem, calculate the similarity