资源列表
humesearch
- 可快速搜索通讯软件,特别是AT指令相关的网站-quick search of communications software, in particular related to the AT command site
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
ishionseotool
- seo工具大全,PR查询 Google收录 Baidu收录 Yisou收录查询 Alexa排名查询-seo tools Daquan, Google PR inquiries included Baidu included Yisou included inquiries Alexa ranking inquiries
使用Java搜索Internet
- Search Crawler 是用于Web搜索的一个基本的搜索程序,它展示了基于搜索程序的应用程序的基础框架。-Search Crawler Web search for a basic search procedures, it features based on the search application's basic framework.
aadfd
- 搜索数据取自百度网站,可实现站内搜索和互联网搜索,速度超快 -Baidu search data from websites, can be realized station search and Internet search, speed Ultrafast
1575465
- 可以查看你的网站在搜索引擎搜索关键中排第几名,可以在数十个搜索引擎中快速找到你网站的位置,含ASP版和ASP+ASP.net两个版本 -can check your website in search engine key ranked number, the number of 10 quick search engine to find your site location, including ASP and ASP version ASP.net 2 version
BlueSearch
- 搜索数据取自百度网站,可实现站内搜索和互联网搜索,速度超快.-The data of searching comes from www.baidu.com. The software can search not only the site,but the internet.And the speed is quit high!
lucene-1.4.3
- java分词技术,只实现英文分词,但是该分词算法很经典(来源于apache)-java-term technology, achieving only English Word, but the Word algorithm classic (from apache)
rj588_tongyicjuniveralgatsy
- 统一搜集系统 Univeral Gather System(UGS) 是针对搜集程序设计的一套PHP类 ,使用方便 运行于各种Unix系统 linux系统和Win2000/XP/2003 系统中 类内函数 steal 用于搜集页面文字 cut/cutpro 用于剪切文字 filt/filtx用于过滤文字 change用于改变文字 getenterkey用于获得关键位置的链接Array _striplinks和_striptext 用于产生锚点的Array和文字-unified collectio
PDFBox-0.6.7a
- 采用java编写的处理PDF文档的程序,可从PDF文档中抽取txt文本,可与lucene搜索引擎相结合。-adopting the java programs compiled to dispose the PDF document, taking out the txt text from the PDF document, and combining with the lucene searcher.
信息检索报告
- Information Retrieval (IR) is the discipline that deals with retrieval of unstructured data, especially textual documents, in response to a query or topic statement, which mayitselfbeunstructured,e.g.,asentenceorevenanotherdocument,orwhichmay be s
Webloup
- WebLoupe is a java-based tool for analysis, interactive visualization (sitemap), and exploration of the information architecture and specific properties of local or publicly accessible websites. Based on web spider (or web crawler) technology. 开源搜索爬