搜索资源列表
helios-4.1g
- a meta serach engine
ChinesewordnetEC
- 用中文Wordnet开发的一个智能搜索引擎,内含中文WordNet词典文件-Chinese Wordnet developed an intelligent search engine, a document containing English WordNet dictionary
spider
- 本系统为简易网络爬虫,输入初始url,系统自动在网上搜索网页信息,并记录下来做为搜索引擎的数据.-The system for the Simple Network reptiles, enter the initial url, system automatically searches the Web page information, and record data as a search engine.
Information_retrieval
- 一个信息检索模型,改进之处在于利用词汇之间的聚合网络实现了搜索引擎参数的自动调整和优化-An information retrieval model, improvement is the use of vocabulary between the converged network to achieve the search engine parameters automatically adjust and optimize
fenci
- 中文分词 中文搜索引擎中的关键字识辨-Chinese word segmentation in Chinese search engine keywords that identify
seadog-installer
- 对于垂直搜索引擎来说,网络蜘蛛是非常重要的,因为在垂直搜索领域,数据的收集工作都是由蜘蛛程序来完成的。垂直搜索引擎除了要设计蜘蛛程序外,还要管理这些蜘蛛程序的运行,这是比较复杂的工作。如果缺乏一套有效的管手段,那么垂直搜索引擎将面临一场恶梦。 然而幸运的是,我们有了海蛛--这个领先的垂直搜索专用网络蜘蛛系统。有了海蛛,垂直搜索更简单!使用了海蛛,一切变得有条不紊,变得简单起来。 -The vertical search engine for Web Spider is very
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅
imdict-chinese-analyzer
- imdict-chinese-analyzer 是 imdict智能词典 的智能中文分词模块,算法基于隐马尔科夫模型(Hidden Markov Model, HMM),是中国科学院计算技术研究所的ictclas中文分词程序的重新实现(基于Java),可以直接为lucene搜索引擎提供简体中文分词支持。-imdict-chinese-analyzer is a smart imdict Chinese Dictionary smart module segmentation algorithm
luyfSearch2.0.tar
- 一个中文分词开发包,可以用到搜索引擎的开发当中,比较好用。-A Chinese word segmentation development kit, you can use search engine in development and are relatively easy to use.
ICTCLAS2012
- ICTCLAS的最新版本2012. 1.增加了CICTCLAS部分函数 2.修正了部分再UTF-8下计算位移偏移量的Bug. 3.ICTCLAS完全兼容开源搜索引擎Sphinx,具体可以访问Sphinx官网; 4.为保障用户使用的便利,从本版开始,调用的dll的名称一律为ICTCLAS2011.dll,不再变化,一般用户只需要变更dll及对应的.user授权文件,无需重新编译自己的程序,即可兼容新版本分词程序。 -ICTCLAS the latest version 2
MaDKit_Tutorial
- MadKit is a modular and scalable multiagent platform written in Java and built upon the AGR (Agent/Group/Role) organizational model: agents are situated in groups and play roles. MadKit allows high heterogeneity in agent architectures and communicati
freetype-2.4.9
- FreeType库是一个完全免费(开源)的、高质量的且可移植的字体引擎,它提供统一的接口来访问多种字体格式文件,包括TrueType, OpenType, Type1, CID, CFF, Windows FON/FNT, X11 PCF等-FreeType library is a completely free (open source), high-quality and portable font engine, which provides a unified interface to
NLU
- 内容很多,包括文本分类、机器翻译、自然语言理解、搜索引擎、词法分析等资料-A lot of content, including text classification, machine translation, natural language understanding, search engine, lexical analysis, etc.