搜索资源列表
weblucene
- Lucene Web interface, use XML as a lightweight protocol. developer can convert data source (text, DB, MS Word, PDF... etc) into xml format, indexing with lucene engine, and get full text search result via HTTP, with XML format output, user can easily
soo_search
- soo search是一个服务的接口,目标为简化搜索引擎的定制规则,加速全文索引的快速高效的开发。通过javaBean技术,把资源对象化,以建立方便的资源管理机制。soosoo search把资源的输入和输出通过一个值对象(bean)和用户进行交互,这样soosoo search可以快速的和现有的j2ee开源框架进行集成。soosoo search提供了两个接口,一个是索引器接口,一个是检索器接口。而这里两个接口的实现都是通过公共的数据模板进行资源的格式化。利用用户定制的javaBean对象,把
sogzq
- 功用:跟踪搜索引擎的蜘蛛(BOT),并进行记录,提供在线察看和生成cvs格式文档下载。-function : tracking search engine spiders (BOT), and make a record, View online and generate cvs format files downloaded.
jspcode(5files)
- 主要是JSP的代码 做网站时用得到 压缩包的内容:1.Jsp分页显示 2.jsp源码实例 搜索引擎 3.javajsp中 中文问题详解-开发技巧 4.JSP实现论坛树型结构的具体算法-开发实例 5.JSP调用JavaBean在网页上动态生成柱状图 共五个Java源码 txt格式 都有源代码和注释 无密码-JSP is mainly done for the code used to be compressed contents : 1.Jsp paging
NetCrawler
- :把网络爬虫爬取的网页加以分析,去除网页中的控制命令和格式,只保留内容-: Reptile climb the network's website for analysis by removing the website of control commands and format, retaining only content
NaturalLanguageSearch
- 自然语言搜索引擎,搜索结果显示在浏览器的右边。初级编程者下。-The user clicks 揝ay It To The Internet?and their sentences is processed by both a search engine and a popular AI chatbot like Hexbot. The search engine image results are displayed on the right and the chatbot抯 response
MetaSeeker-4.11.2
- 主要应用领域: • 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量采集,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 • 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地 采集内容,输出富含语义元数据的XML格式的抓取结果文件,确保自动化
spider
- 是网络爬虫方面的PDF格式的文档资料,主要介绍了爬网方面的技术原理及代码示例,涉及到JAVA方面的线程知识。-Reptiles in the network documentation in PDF format, focuses on the crawl technical principles and code samples, related to the knowledge of JAVA in the thread.
Search.test1
- 主要是測試以asp.net下載網路上的檔案,並可以解析word,excel,pdf格式的檔案為文字檔。限制:必須安裝office 2-The test asp.net download files over the Internet, and can parse word, excel, pdf format file as a text file. Restrictions: must install office 2000
pubchem
- web crawler,python ,针对puchem,收取化学物质信息,以csv格式记录。采用beautifulsoup 开发,采用lxml解析器,爬取速度较慢,请多等待。可以修改指定爬取范围,也可以根据cid来爬取(Web crawler, python, for puchem, collection of chemical information, recorded in CSV format. Use beautifulsoup development, use lxml parser