资源列表
Iindex
- 根据国外ISite检索引擎改写,原代码是运行在Linux平台上,改写为Windows命令行程序-abroad ISite rewritten search engine, the original code is run on the Linux platform. rewritten for the Windows command line procedures
lucene_Google
- 基于Lucene的一个仿Google的搜索引擎提示。-Imitation of a Lucene-based search engine Google tips.
DotLuceneSearch_src
- 在.net下应用的一个搜索引擎的源代码。
Searcharoo
- web search engine: refactored to search Word, PDF and more
Analysis-Based-on-Multi-Agent-Search
- 为解决传统搜索引擎个性化的局限性问题,在研究用户感兴趣搜索引擎现状基础上,通过多Agent较全面记录、分析用户搜索的行为,提出了一种新的综合用户搜索行为,构建用户感兴趣搜索引擎研究框架—— 基于多Agent搜索行为分析的用户兴趣模型。研究结果表明,依据用户搜索行为构建用户兴趣模型,使搜索引擎返回结果更贴近用户需求。满足用户个性化服务,提高了信息搜索的查全率和查准率。-In order to solve the limitations of search engine personalizat
lucene-core-2.0.0
- 超强的全文检索lucene-core-2.0.0源代码java完整版,以前网上找到的一般不是完全的代码,好不容易要来一份完全版的。大家一起分享-super text retrieval lucene-core-2.0.0 integrity of the source code version of java, find online before the general code is not complete enough to want to come to a complete vers
web-search
- LINUX环境下,网站搜索引擎,建立一个搜索网站,搜索的目标网站是可以自定义。
clucene_src_for_chinese
- 汉化CLucene今天,把CLucene的程序改了一下,可以支持汉字了。1.在vc 6编译 2.还不支持分词,但支持汉字,要索引的文本词与词之间用空格隔开。3.只是匆匆改了一下,见demo/IndexFiles.cpp,有问题可以与我联系。有空时改完善些。 -finished CLucene today, CLucene procedures changed a bit in support of the Chinese characters. 1. In vc 6 2 comp
datasheet(1)
- 这是一个实用集成电路查询软件,用它可方便下载您所需的器件pdf资料。-This is a practical integrated circuit query software, use it to conveniently download pdf information on the device you need.
searchsheet
- 搜索芯片的软件。以方便搜集芯片资料来学习和使用相应芯片。-Search-chip software. To facilitate the collection of information to learn and use the chip, the corresponding chip.
Introduction-IR
- 信息检索简介ppt
NWebCrawler
- 网络爬虫, * 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 * 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 * 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 * 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 * 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等。-Web crawler