资源列表
NwebCrawler
- NwebCrawler是用C#写的一款多线程网络爬虫程序,它的实现原理是先输入一个或多个种子URL到队列中,然后从队列中提取URL(先进先出原则),分析此网页寻找相应标签并获得其href属性值,爬取有用的链接网页并存入网页库中,其中用爬取历史来记录爬过的网页,这样避免了重复爬取。提取URL存入队列中,进行下一轮爬取。所以NwebCrawler的搜索策略为广度优先搜索。采用广度优先策略有利于多个线程并行爬取而且抓取的封闭性很强。-NwebCrawler is a multi-threaded w
tt
- 给出了求解公切线的算法和网络搜索球机制的算法。-Given the algorithm for solving common tangent ball mechanism and network search algorithms.
baidu
- 百度(baidu)分词算法分析 有关百度搜索的数据分析-baidu
网虫搜索引擎
- 网虫搜索引擎是一个基于PERL的搜索引擎原代码。软件大小:14Kb。-slightly slower than the search engine is a PERL-based search engine source code. Software Size : 14Kb.
LuceneWeb
- 基于开源的搜索引擎框架lucene开发的简易的搜索引擎,对初步理解lucene框架很有帮助-Open source search engine based on lucene framework for the development of simple search engine, a preliminary understanding of the framework lucene helpful
search0.zip
- 查找自制的关键字数据文件中的关键字的搜索程序
文本自动分类在搜索引擎上的应用
- 文本自动分类在搜索引擎上的应用-automatic text classification search engines on the application
Google_AdWords_API_Java_Client_Sample
- Google AdWords API Java 客户端库示例
PythonWork
- 一种面向对象的解释型计算机程序设计语言,在设计中注重代码的可读性,同时也是一种功能强大的通用型语言(An object-oriented interpretive computer programming language, which focuses on code readability in design, and is also a powerful universal language.)
IPAddressSerch
- C#写的IP地址查询程序,内附IP.dat-write C# the IP address inquiry procedures, enclosing IP.dat
searchenginecode.rar
- 主要工作是对web搜索程序进行研究;并且利用java语言实现了search crawler的搜索程序界面.,The main work is to study procedures for web search and the use of java language to achieve a search crawler search program interface.
SearchEngine
- 搭建一个简易的搜索引擎指引。附《搜索引擎原理与实践》源码。-To build a simple search engine guidelines. Attached to " search engine theory and practice" source.