搜索资源列表
word_vc
- vc++实现的基于字典的中文分词算法,基于贝耶斯网络的概率中文分词算法,以及文本相似程度比较的算法。
JWordNetSim
- java实现的基于wordnet的单词匹配算法,输出为待比较的词的相似度
wordnet20
- 这是个语义网络WordNet,能进行两个词的相似度的比较。
SentenceSimilar.rar
- 先对句子分词,然后根据词来比较句子的相似度,这个算法清晰易懂,欢迎下载!,The first word of the sentence, and then to compare the sentence the word similarity, this algorithm is clear and easy to understand, welcome to download!
NETspider
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。-Search is a commander based on the Microsoft. NET
SpellDictionary_src
- 一个智能拼写语法检测器,带提示功能,其核心算法就是用的一个三元树来实现相似词的存储。-ternary tree spell check
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
YH_zhizhu_1.0
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。 产品适用范围: 行业垂直搜索引擎、大型新闻门户网站站内搜索、大型行业门户网站
English_word_helper
- 1)输入单词,判断其是否正确,如果错误,给出纠正的建议; 2)输入不完整的单词,可以补全单词 3)输入单词以及数字m,要求与输入字符串中第m个字符有差异的相似词 -1) Enter the word to determine whether it is correct, if wrong, give correct recommendations 2) Enter the incomplete words, you can complete the word 3) type the
SimCalc
- 用语义词典wordnet计算两个词的相似度的算法。-The algorithms to calculates two words similarity with the semantic dictionary wordnet.
chen
- 在非线性科学中,“混沌”这个词的含义和本意相似但又不完全一致,非线性科学中的混沌现象指的是一种确定的但不可预测的运动状态。它的外在表现和纯粹的随机运动很相似,即都不可预测。但和随机运动不同的是,混沌运动在动力学上是确定的,它的不可预测性是来源于运动的不稳定性。或者说混沌系统对无限小的初值变动和微绕也具于敏感性,无论多小的扰动在长时间以后,也会使系统彻底偏离原来的演化方向。混沌现象是自然界中的普遍现象,天气变化就是一个典型的混沌运动。混沌现象的一个著名表述就是蝴蝶效应:南美洲一只蝴蝶扇一扇翅膀,就
participle
- 这是关于句子相似度处理前的一个分词处理,希望可以帮到你!-This is about common sentence similarity processing of a points before word processing, not write the source code, is just a algorithm model!
similarityCalculation
- 用c#方法描述了话题识别(话题跟踪与检测)的过程,主要是提取特征词、特征词词频计算、权重计算(tfidf方法),进行相似度计算,最后聚类-C# method describes the process of topic identification (topic tracking and detection), the word feature extraction, feature words word frequency calculation, weight to calculate me
jwnl14-rc1
- jwnl 利用WORDNET计算两个词项的相似度-jwnl use WORDNET calculate the similarity of two words
20257147knn
- knn最近邻算法在给定新文本后,考虑在训练文本集中与该新文本距离最近(最相似)的 K 篇文本,根据这 K 篇文本所属的类别判定新文本所属的类别,具体的算法步骤如下: 一、:根据特征项集合重新描述训练文本向量 二、:在新文本到达后,根据特征词分词新文本,确定新文本的向量表示 三、:在训练文本集中选出与新文本最相似的 K 个文本-knn nearest neighbor algorithm in the given text, to consider in the train
Jzu_File_so
- 详细介绍 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎,适用于 Windows 平台下的各种网站系统。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,无处不体现着她的强大与魅力。-The detail commander search is one based on the Microsoft NET 2.0 development of vertical s
cos
- 计算词向量间的余弦相似度,用于语义文本挖掘 。(Calculate the cosine similarity between word vectors for semantic text mining.)
word2vec
- 用java语言编写的查找中文相似词功能,欢迎大家使用(Find Chinese similar words)
word2vecC实现代码
- 实现词语的特征扩展和相似词查找;关系挖掘;作为系列的初始化输入特征。(Realize word feature extension and similar word search.)
新闻言论自动提取
- 根据新闻的内容,在线提取言论实体与发表的观点,利用哈工大的pyltp语言模型对输入的新闻进行分句、分词、命名实体识别,判断新闻是否存在实体,对包含实体的内容进行依存句法分析,若谓语存在相似词列表中,则后面句子为观点内容。