资源列表
ANN
- ANN是一个加快搜索速度的源码程序;通过C++编写,支持在任意高维空间的近似或准确的最近邻搜索。
HZ_Freq
- java中文分词系统,可供大家学习,祝成功路上越走越远!-Java wordseg program
WebCrawler
- 一款利用WebBrowser的网络爬虫,适合初学者-A network crawler using WebBrowser , suitable for beginners
fenci
- 一个简单的基于词典分词的程序,lucene的分词程序不少,但有时候并不需要复杂的功能,只是需要简单的根据指定的词典分词。代码简单,可以作为学习参考-A simple dictionary-based word process, lucene procedures for sub-word a lot, but sometimes does not require complex functions, but only require a simple dictionary word accord
query_click_distribution
- 一个处理搜索引擎中的用户搜索词相关的url点击数据的程序,用来分析query是informational还是navigational。-A deal with search engine users search for words related to the procedure url click data to analyze query is informational or navigational.
trafic_inquirement
- (1)提供对城市信息进行编辑的功能。 (2)城市与城市有两种交通工具,提供对列车时刻表和飞机航班进行那个编辑的功能。 (3)在全程只考虑一种交通工具的前提下,提供三种最优策略:最省钱、最快捷、或者换乘次数最少。 (4)由用户输入起始站、终点站、最优决策原则和交通工具,输出相应搜索结果。 -(1) to provide information on the city editor functions. (2) There are two cities and urban trans
lucene-demos-2.9.1.jar
- 一个基于Luncene做的搜索引擎开发包-Do a search engine based on Luncene Development Kit
KTDictSeg_v1.2.02
- KTDictSeg 一种简单快速准确的中文分词方法
ir
- 基于网页的倒排文件建立及查找 附源码及报告说明-Find attached source code and report illustrates web-based inverted file
Compass
- Compass 入门指南 Compass 通过OSEM(Object/Search Engine Mapping)允许把应用对象的领域模型映射到搜索引擎,最终通过访问common meta data来达到访问对象的目的-Compass Getting Started Guide
lucene
- 一个很好的搜索引擎工具,可以嵌入具体应用项目中使用,但不是全文索引的专业搜索引擎。-a good search engine that can be embedded in specific applications to use, but it is not indexed by the professional search engine.
search_engine
- 搜索引擎 控件内置多线程下载. 内置html完全解释.(解释了90%左右html脚本, 容错控制采用仿ie的技术) 内置javascrip有限解释.(解释了基本循环, 字符操作运算和整型运算) 内置正文分析的分解.(只仅中文简体) 后三项可以关掉, 采用第三方技术.