搜索资源列表
仿百度搜索引擎NET 2.0
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。
test
- 计算句子的相似度,分为计算词形相似度和词序相似度。使用中科院提供的分词工具实现分词。-Calculate sentence similarity, divided into the calculation of word shape similarity and word order similarity. Use segmentation tools provided by the Chinese Academy of Sciences segmentation.
Similar
- wordnet中两个词的相似度算法实现。-wordnet similarity algorithm
1661a86897bc
- 余弦相似度算法(余弦相似度(cosine similarity)是资讯检索中常用的相似度计算方式,可用来计算文件之间的相似度,也可以计算词汇之间的相似度,更可以计算查询字串与文件之间的相似度。) 这是一个基于Jcseg分词算法的余弦相似度例子,运行com.fenci.test.IKMainTest可以查看运行结果。-please do it by yourself
similarityOfDocuments
- 利用词袋模型计算新闻的相关性,按照相似度由高到低返回新闻id-compute similarity of articals using bag of words model
wordnet
- 这是一款进行词义分析的 wordnet调用程序,可以进行相似词计算,以及寻找父类词等-wordnet use