资源列表
webspider
- 用java写的一个网络蜘蛛,他可以从指定的URL开始解析抓取网页上的URL,对于抓取到的URL自动分成站内外URL,并可以设置抓取的深度。
SPIDER
- 网络爬虫,有简易的图形界面,用于抓取网页-nerwork crawler
aca
- 网络节点中最小路径以及所有路径的搜索方法-Network nodes and all paths in the minimum path search method
pachong
- 这是自己写的代码,经过运行后实现,觉得应该对大家有所帮助。-This is to write the code, after running after that we should be helpful to everyone.
src
- 利用lucene编写的一个简单搜索引擎,能够中文分词。-a simple search engine built with lucene.
windows应用程序版的google搜索引擎源码
- 很多时候感觉用www.google.com搜索网站挺麻烦的,查阅MSDN的知识库后用C#写了这个windows应用程序版的google搜索引擎,主要调用了google开放出来的web service,不过搜索时速度还不是很快,但至少省去了右键[在新窗口中打开]的麻烦,以下是程序的源码. -often feel www.google.com search site with a very troublesome to access the knowledge base after MSDN
SearchCrawler
- 网络爬虫的实现 能够比较好的爬行网页 能对网络链接简单分析
danchunxing
- 单纯形搜索算法程序,用于快速搜索多变量函数的局部极小值。-Simplex search algorithm procedure for fast search multi-variable function of the local minimum value.
python_sina_crawl
- 新浪微博的爬虫程序。程序运行方式:保存所有代码后,打开Main.py,修改LoginName为你的新浪微博帐号,PassWord为你的密码。运行Main.py,程序会在当前目录下生成CrawledPages文件夹,并保存所有爬取到的文件在这个文件夹中。-Sina microblogging reptiles. Program operation: save all the code, open Main.py, modify LoginName for your Sina Weibo accou
04799160weblogdig
- c++写的非常好的搜索引擎代码,值得学习借鉴-c++ to write a very good search engine code, it is worth to learn from
similarity.文本相似度计算余弦相似度代码
- 文本相似度计算余弦相似度代码,计算文本相似度,用于搜索引擎,Cosine similarity of text similarity computation code, the text of the similarity calculation for the search engine
jasearch
- 简单的全路径全文搜索的程序 -Simple all path and text search a