搜索资源列表
Word2VEC_java-master
- 谷歌开源的计算词语相似度的源码,word2vec-compue the similarity of words
FCM
- 核聚类算法:聚类是将一组给定的未知类标号的样本分成内在的多个类别,使得同一类中 的样本具有较高的相似度,而不同类中的样本差别大。侧重于软聚类(模糊C-均值——FCM),但其描述手段同样适合于硬聚 类(HCM)等同类问题。-Clustering algorithm: cluster is a group of unknown samples given class label into internal multiple categories, so that the same class
k-means-Java
- 用JAVA实现k-means算法,其中聚类方法使用余弦相似度,带运行界面。完美运行。-Using JAVA k-means algorithm, clustering method using the cosine similarity
pujulei
- 谱聚类算法建立在谱图理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。-Spectral clustering algorithm based on the spectrum b
1
- 检测中文文章的相似度,首先对中文文章分词处理,然后提取特征,计算特征向量夹角。检验是否相似-Similarity detection Chinese article, the first article of the Chinese word processing and feature extraction, feature vector angle calculation. Test whether similar
2
- 每一位作家都有自己的写作风格,词语的使用方面会有很大的不同,根据文章中的虚词的使用情况,计算两篇文章的余弦值。检测两篇文章的相似度。-Every writer has their own style of writing aspect, the use of the words will be very different, according to the article in the function words usage, calculate the cosine of the two
GoogleNormalDistanceCalculator
- 计算两个词语的google相似度,即google normal distance-To calculate the distance between two words with google normal distance algorithm.
WordSimilarity
- 基于知网的相似度计算算法,可计算不同词语间的相似度-HowNet based similarity calculation algorithm, calculating the similarity between words can be different
Recommender
- 基于MovieLens数据,通过计算余弦相似度,Python语言构建的一个简单协同过滤推荐系统,并给出RMSE等测评结果-Based MovieLens data by calculating the cosine similarity, Python language to build a simple collaborative filtering systems, and the like are given RMSE uation results
ecoli
- 聚类是将数据对象分组成多个簇(Cluster),同一个簇内 部的任意两个对象之间具有较高的 ),同一个簇内 部的任意两个对象之间具有较高的 相似度,而属于不同簇 的两个对象间具有较高的 ,而属于不同簇 的两个对象间具有较高的 相异度。相异度可以根据描述对 象的属性值计算,对象间的距离是最常采用的度量指标。-Clustering is a data object into a plurality of clusters (the Cluster), with a clu
python_s
- 计算两个文本间的相似度,并且返回相速度值,用于确定两个文本将的距离(Compute the similarity between two short txts)