搜索资源列表
participle
- 这是关于句子相似度处理前的一个分词处理,希望可以帮到你!-This is about common sentence similarity processing of a points before word processing, not write the source code, is just a algorithm model!
similarityCalculation
- 用c#方法描述了话题识别(话题跟踪与检测)的过程,主要是提取特征词、特征词词频计算、权重计算(tfidf方法),进行相似度计算,最后聚类-C# method describes the process of topic identification (topic tracking and detection), the word feature extraction, feature words word frequency calculation, weight to calculate me
jwnl14-rc1
- jwnl 利用WORDNET计算两个词项的相似度-jwnl use WORDNET calculate the similarity of two words
20257147knn
- knn最近邻算法在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的 K 篇文本,根据这 K 篇文本所属的类别判定新文本所属的类别,具体的算法步骤如下: 一、:根据特征项集合重新描述训练文本向量 二、:在新文本到达后,根据特征词分词新文本,确定新文本的向量表示 三、:在训练文本集中选出与新文本最相似的 K 个文本-knn nearest neighbor algorithm in the given text, to consider in the train
test
- 计算句子的相似度,分为计算词形相似度和词序相似度。使用中科院提供的分词工具实现分词。-Calculate sentence similarity, divided into the calculation of word shape similarity and word order similarity. Use segmentation tools provided by the Chinese Academy of Sciences segmentation.
Jzu_File_so
- 详细介绍 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎,适用于 Windows 平台下的各种网站系统。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,无处不体现着她的强大与魅力。-The detail commander search is one based on the Microsoft NET 2.0 development of vertical s
Chinese-thesaurus
- 同义词词林的词典文件和相关的说明,主要用于语义相似的计算-Chinese thesaurus
Similar
- wordnet中两个词的相似度算法实现。-wordnet similarity algorithm
bb
- 淘宝中用来做评论近义词分析,利用左右上下文的相似度-Taobao to comment synonyms analysis, using the left and right context similarity
FENLEI
- 淘宝中用来做评论近义词分析,利用左右上下文的相似度-Taobao to comment synonyms analysis, using the left and right context similarity
semantic-similarity
- 对语言的语义相似度进行计算,给出两个词的相似值,相似值的范围是1到5之间,实现是用java实现-Language for semantic similarity calculation, give similar values of the two words, similar to the range of values is between 1-5, implementation is using java
ddtw
- 基于DWT计算两个向量之间的距离,用于音节或者词的相似度比较-calculation the distance between 2 vectors, for comparing the similarity of 2 syllables or words
1661a86897bc
- 余弦相似度算法(余弦相似度(cosine similarity)是资讯检索中常用的相似度计算方式,可用来计算文件之间的相似度,也可以计算词汇之间的相似度,更可以计算查询字串与文件之间的相似度。) 这是一个基于Jcseg分词算法的余弦相似度例子,运行com.fenci.test.IKMainTest可以查看运行结果。-please do it by yourself
similarityOfDocuments
- 利用词袋模型计算新闻的相关性,按照相似度由高到低返回新闻id-compute similarity of articals using bag of words model
similarity
- 求字符串s1和s2的最大公共字串,衡量文档的相似度,体现了词的顺序。-The biggest public string for strings s1 and s2, measure the similarity of document, embodies the word order.
1
- 检测中文文章的相似度,首先对中文文章分词处理,然后提取特征,计算特征向量夹角。检验是否相似-Similarity detection Chinese article, the first article of the Chinese word processing and feature extraction, feature vector angle calculation. Test whether similar
testsurf
- surf方法对多组图片分类:对于多组图片,训练词库,利用词库表示图片比较每一张与其他组的相似度,依照各图片相似度累加,评判各组之间的相似关系-surf multiple sets of image classification method: For the multiple sets of pictures, training thesaurus using thesaurus compare each image represents a similarity with other grou
DTW
- Dynamic Time Warping(DTW)诞生有一定的历史了(日本学者Itakura提出),它出现的目的也比较单纯,是一种衡量两个长度不同的时间序列的相似度的方法。应用也比较广,主要是在模板匹配中,比如说用在孤立词语音识别(识别两段语音是否表示同一个单词),手势识别,数据挖掘和信息检索等中。(The birth of Dynamic Time Warping (DTW) has a certain history (Itakura, a Japanese scholar), and it
English
- 包括了原始英文文档、删除特殊符号、分词、词干化、计算相似度等文本预处理后产生的文档,总的数量是500个英文文档(Including the original English document, delete special symbols, such as text segmentation, a preprocessed documents produced, the total number of 500 English document)
Chinese
- 是做文本预处理时候利用爬虫收集的500个中文文档,包括分词部分、去掉特殊符号部分以及最后的相似度计算等(It is the 500 Chinese document collected by a crawler for text preprocessing, including the part of the participle, the removal of the special part of the symbol, and the final similarity calculatio