搜索资源列表
SearchPicture_bemjh
- 用jsp开发的基于文本对图片进行搜索的系统实现,服务器是tomcat-with jsp development of the text-based search for pictures of the realization of the system, the server is tomcat
Project1(local)
- 完成最基本功能的本地简易字符串搜索(文本匹配)引擎,还不支持对中文的检索
Project1(soap)
- 采用SOAP协议的简单文本搜索引擎,可在客户端向服务器端发出请求,并进而在服务器端的文本文件中查询特定字符串,目前还不能支持中文搜索。
holmes-3.11.tar
- Sherlock Holmes搜索引擎,可以对本地或网络上文本文件(网页,文件。。)创建索引-Sherlock Holmes search engine, can be local or network text file (pages, documents..) Create index
firtex-1.2.0_RC_src
- FirteX是一个功能强大、高性能、灵活的全文索引和检索平台。FirteX的主要目标是研究文本索引的快速构建(Index Construction),动态文档集的索引维护(Index Maintenance),短语查询(Phrase Query),Top-k查询的快速处理(Top-k Query Process)以及各种检索模型(IR Model)等。高性能和灵活的架构也使FirteX可以应用在产品搜索,桌面搜索,站内搜索,新闻搜索,Blog搜索,学术搜索以及大规模搜索引擎等领域中。-Firte
websearch
- 文本检索的理论体系支撑着整个Web搜索领域的发展,它给出了Web搜索的基本概念、基本模型和基本方法 -web search
search.class
- 文本搜索类,支持全文搜索及关键字高亮显示,搜索结果类似百度的搜索结果-a class of text search,which support all text search and highlighting keywords,the result looks like the result of BAIDU
textsearch
- 一个超快的文本搜索算法 searchi = search ignore case search = search case sensitive searchiw = search ignore case words only (e.g. words delimited by whitespace only, not words within words) searchw() = search case sensitive words only -Super
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过
lucene
- lucene搜索, 对不同的文本使用不同的分析-lucene search using a different analysis of different text
openbaidu
- 实现导入文本关键字后批量打开百度搜索,方便大批量搜索指定关键字-After the realization of the bulk import text keyword search Baidu open
SearchEngine
- dySE 是个开源的 Java 小型搜索引擎。该搜索引擎分为三个模块:爬虫模块、预处理模块和搜索模块。其中详细阐述了: 多线程页面爬取、正文内容提取、文本提取、分词、索引建立、快照等功能的实现。-dySE is an open source Java small search engines. The search engine is divided into three modules: crawler module, pretreatment module and search module