搜索资源列表
chinatext
- 汉字关联性量化方法及其在文本相似性分析中的应用-Chinese relevance and quantitative methods in the text similarity analysis of
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
Similarity-Measures-for-Text-Document-Clustering.
- Similarity Measures for Text Document Clustering
The-LCS-algorithm
- LCS算法实现简单中文文本相似度分析-最大公共子串-The LCS algorithm to implement a simple text similarity analysis- the largest public substring
wenbenleiju
- 基于文本相似度计算的文本聚类算法研究与实现,这是中文信息处理的重要分支。-The text clustering algorithm based on text similarity computing research and implementation, this is an important branch of Chinese information processing.
IR-project
- 1-The Cranfield collection is a standard IR text collection(included in this directory)., consisting of 1400 documents the aerodynamics field.Write a program that preprocesses the collection.Determine the frequency of occurence for all the words in t
a-sens-similar-method
- 多种短文本处理与相似度分析短,应用于文本挖掘方法,安装包-Short text processing and similarity analysis is short, which is applied to text mining.
analyze
- 实现比较文本的差异,和得到两个文本的最大相似度(Implementing the comparison text and getting the maximum similarity)