搜索资源列表
cpp
- 文章查重源码 应用了最短编辑距离算法以及相似度算法原理,用两个待比较的文本框输入要比较的的文本文字,然后求解,最后输出两篇文章的相似度的百分比 -The article source application rechecking the shortest edit distance algorithm and the similarity principle, comparing two stay text box input to compare the text of the text,
Program1
- 这是中文信息处理的分词算法实现,具有很高的正确率和使用价值!这是分词算法的核心内容!具有很高的参考价值。-The text clustering algorithm based on text similarity computing research and implementation, this is an important branch of Chinese information processing.
SimHash
- simhash算法的实现,可快速比较文本的相似性-achieve simhash algorithm can quickly compare the similarity of text