搜索资源列表
word_vc
- vc++实现的基于字典的中文分词算法,基于贝耶斯网络的概率中文分词算法,以及文本相似程度比较的算法。
JWordNetSim
- java实现的基于wordnet的单词匹配算法,输出为待比较的词的相似度
wordnet20
- 这是个语义网络WordNet,能进行两个词的相似度的比较。
关于linux下文件编译的方法
- 摘 要: 本文主要阐述了关于linux下文件编译的方法以及vim编辑器的配置,并介绍了linux下热门开发工具。 关 键 词: vim配置与使用;linux文件编译;linux下热门开发工具 引 言: 1.一般拿到新的服务器都需要自己配置一下vim的环境,要不觉得总是不是很顺手。本文介绍了vim的基本配置以及一些个性化配置,用户可根据自己喜好及习惯自由配置;2.介绍了Linux文本编译的常用编译命令选项和多源文件编译方法,使读者对linux下文件编译有一个直观的了解;3.介绍了常用linux下开
仿百度搜索引擎NET 2.0
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。
SentenceSimilar.rar
- 先对句子分词,然后根据词来比较句子的相似度,这个算法清晰易懂,欢迎下载!,The first word of the sentence, and then to compare the sentence the word similarity, this algorithm is clear and easy to understand, welcome to download!
NETspider
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。-Search is a commander based on the Microsoft. NET
SpellDictionary_src
- 一个智能拼写语法检测器,带提示功能,其核心算法就是用的一个三元树来实现相似词的存储。-ternary tree spell check
textFCM
- 应用FCM(模糊c均值聚类)算法到文本聚类 采用两种方法计算文本相似度 采用ShootSeg分词 采用sogou互联网词库简化特征值计算-err
YH_zhizhu_1.0
- 军长搜索是一款基于 Microsoft .NET 2.0 开发的垂直搜索引擎。系统有着强大的文件和数据库引索能力,支持中英文分词,文件相似度分析排序,文件数据时实监控与更新,恐龙级的引索速度和毫秒级的搜索速度,搜索结果高亮显示,系统分两部分组成第一部分是C/s的搜索蜘蛛,第二部分是B/s的 WEB用户搜索显示界面,其整个系统的工作过程完全模仿了超级搜索引擎的工作原理。系统支持对站内和全网的引索。 产品适用范围: 行业垂直搜索引擎、大型新闻门户网站站内搜索、大型行业门户网站
English_word_helper
- 1)输入单词,判断其是否正确,如果错误,给出纠正的建议; 2)输入不完整的单词,可以补全单词 3)输入单词以及数字m,要求与输入字符串中第m个字符有差异的相似词 -1) Enter the word to determine whether it is correct, if wrong, give correct recommendations 2) Enter the incomplete words, you can complete the word 3) type the
File22
- 基于关键词的Web文档自动分类算法研究,文档关键词,语义相似度,聚类算法,知网,拓扑网络图,中文分词-Keyword-based Web Document Classification Algorithm, document keywords, semantic similarity, clustering algorithm, HowNet, topological network diagrams, Chinese word segmentation
SimCalc
- 用语义词典wordnet计算两个词的相似度的算法。-The algorithms to calculates two words similarity with the semantic dictionary wordnet.
chen
- 在非线性科学中,“混沌”这个词的含义和本意相似但又不完全一致,非线性科学中的混沌现象指的是一种确定的但不可预测的运动状态。它的外在表现和纯粹的随机运动很相似,即都不可预测。但和随机运动不同的是,混沌运动在动力学上是确定的,它的不可预测性是来源于运动的不稳定性。或者说混沌系统对无限小的初值变动和微绕也具于敏感性,无论多小的扰动在长时间以后,也会使系统彻底偏离原来的演化方向。混沌现象是自然界中的普遍现象,天气变化就是一个典型的混沌运动。混沌现象的一个著名表述就是蝴蝶效应:南美洲一只蝴蝶扇一扇翅膀,就
wordnet
- 这是一款进行词义分析的 wordnet调用程序,可以进行相似词计算,以及寻找父类词等-wordnet use
cos
- 计算词向量间的余弦相似度,用于语义文本挖掘 。(Calculate the cosine similarity between word vectors for semantic text mining.)
word2vec
- 用java语言编写的查找中文相似词功能,欢迎大家使用(Find Chinese similar words)
word2vecC实现代码
- 实现词语的特征扩展和相似词查找;关系挖掘;作为系列的初始化输入特征。(Realize word feature extension and similar word search.)
新闻言论自动提取
- 根据新闻的内容,在线提取言论实体与发表的观点,利用哈工大的pyltp语言模型对输入的新闻进行分句、分词、命名实体识别,判断新闻是否存在实体,对包含实体的内容进行依存句法分析,若谓语存在相似词列表中,则后面句子为观点内容。
相似度衡量指标
- 主要介绍词向量有哪些相似度的方法衡量,以及对于的参考文献有,主要涉及到医疗领域的评估