搜索资源列表
Word2VEC_java-master
- 谷歌开源的计算词语相似度的源码,word2vec-compue the similarity of words
FCM
- 核聚类算法:聚类是将一组给定的未知类标号的样本分成内在的多个类别,使得同一类中 的样本具有较高的相似度,而不同类中的样本差别大。侧重于软聚类(模糊C-均值——FCM),但其描述手段同样适合于硬聚 类(HCM)等同类问题。-Clustering algorithm: cluster is a group of unknown samples given class label into internal multiple categories, so that the same class
k-means-Java
- 用JAVA实现k-means算法,其中聚类方法使用余弦相似度,带运行界面。完美运行。-Using JAVA k-means algorithm, clustering method using the cosine similarity
pujulei
- 谱聚类算法建立在谱图理论基础上,与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点。 该算法首先根据给定的样本数据集定义一个描述成对数据点相似度的亲合矩阵,并且计算矩阵的特征值和特征向量 , 然后选择合适 的特征向量聚类不同的数据点。谱聚类算法最初用于计算机视觉 、VLS I 设计等领域, 最近才开始用于机器学习中,并迅速成为国际上机器学习领域的研究热点。-Spectral clustering algorithm based on the spectrum b
1
- 检测中文文章的相似度,首先对中文文章分词处理,然后提取特征,计算特征向量夹角。检验是否相似-Similarity detection Chinese article, the first article of the Chinese word processing and feature extraction, feature vector angle calculation. Test whether similar
2
- 每一位作家都有自己的写作风格,词语的使用方面会有很大的不同,根据文章中的虚词的使用情况,计算两篇文章的余弦值。检测两篇文章的相似度。-Every writer has their own style of writing aspect, the use of the words will be very different, according to the article in the function words usage, calculate the cosine of the two
Cosine-cross-similarity
- 利用cosin余弦距离量化不同数据集间相似性测度的matlab函数-quantize the similarity between data sets using cosin distance
Congressional-voting-similarity
- 用相似性矩阵计算出有相似投票倾向的议员,同时预测其党派倾向-Congressional voting similarity
WordSimilarity
- 基于知网的相似度计算算法,可计算不同词语间的相似度-HowNet based similarity calculation algorithm, calculating the similarity between words can be different
fuzzy
- 模糊聚类分析是根据客观事物间的特征、亲疏程度、相似性,通过建立模糊相似关系对客观事物进行聚类的分析方法。-Fuzzy clustering analysis based on objective characteristics, the degree of relatedness, similarity, through the establishment of fuzzy cluster analysis method of objective things.
Recommender
- 基于MovieLens数据,通过计算余弦相似度,Python语言构建的一个简单协同过滤推荐系统,并给出RMSE等测评结果-Based MovieLens data by calculating the cosine similarity, Python language to build a simple collaborative filtering systems, and the like are given RMSE uation results
ecoli
- 聚类是将数据对象分组成多个簇(Cluster),同一个簇内 部的任意两个对象之间具有较高的 ),同一个簇内 部的任意两个对象之间具有较高的 相似度,而属于不同簇 的两个对象间具有较高的 ,而属于不同簇 的两个对象间具有较高的 相异度。相异度可以根据描述对 象的属性值计算,对象间的距离是最常采用的度量指标。-Clustering is a data object into a plurality of clusters (the Cluster), with a clu
聚类
- 相似性划分,Q型聚类,是理想的多变量统计技术,主要有分层聚类法和迭代聚类法。 聚类分析也称群分析、点群分析,是研究分类的一种多元统计方法。(Similarity classification and Q clustering are ideal multivariate statistical techniques, including hierarchical clustering and iterative clustering. Cluster analysis, also known a
python_s
- 计算两个文本间的相似度,并且返回相速度值,用于确定两个文本将的距离(Compute the similarity between two short txts)