搜索资源列表
jspider-0.5.0-dev
- 一个由java实现的搜索引擎代码。实现对网页内容的分析和采集功能-a realization by the search engine code. Achieving the right Web content collection and analysis functions
BeeCollector
- 小蜜蜂采集器文章采集器使用指南。可以添加网站和URL-Bee article collector collector use of the guidelines. They can add websites and the URL
Aibo_SohuHouse
- 网页数据采集系统,非常好用,不防试试.网页数据采集系统,非常好用,不防-website data acquisition system is very convenient, and preventing a try. Data Acquisition System website, very convenient, try not defense
InformationCollectionSystemcode
- 信息采集系统源码 使用语言为:ASP.NET-source information collection system for the use of language : ASP.NET
Spider
- 采用c#写的SPider源代码,可用来做定向采集或蜘蛛.有问题可联系fancy_blue@163.com,欢迎交流
Robot
- 信息采集Robot的实现及应用,详细讲述了ROBOT的开发和应用技术
zy
- 中英文专业搜索引擎中数据采集加工的设计与实现
kooxoo
- 在线采集源程序,kooxoo初期代码,供学习研究
bot
- java 网络爬虫,可用于网站采集,搜索,
Googlecaiji
- Google资讯采集 用正则匹配网站源代码 然后把需要的信息列出来
BeeCollector
- * BeeCollector,中文全称为“小蜜蜂采集器”,以下简称BC; * 欢迎使用不受目标语言限制、不选存储对象数据库的在线采集器,Google、Baidu搜索排名第一,完全免费,放心使用。 * 在您开始使用之前,请务必完整阅读本软件附带的全部说明档 * 您目前所使用的版本 V1.1031 06.10.31 19:52
caiji
- 多线程采集C#源代码 (包含全部源码)-Multi-threaded collection C# Source code (including all source code)
NetBoverticalsearchengine
- 网博垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合; 4.最新新闻系统已增加伪静态与全站生成静态功能。 5.后台地址:htt://xxx/admin/login.aspx,后台用户名:webhww 密码:http://s.webabc.com.cn/-Net Bo vertical
NewsCollection
- 新闻采集,可配置成采集任意新闻.包括图片自动下载,过滤HTML等功能-news collection
datascraper_zh
- DataScraper是网页信息提取(抽取)工具箱MetaSeeker中的一个工具,可以提取任何网站,为一个网站定制提取规则时不用编程,操作GUI,规则自动生成。适合做 1. 垂直搜索(或称为专业搜索)服务 2. 信息汇聚和门户服务 3. Mashup服务 4. 企业网信息汇聚 5. 商业情报采集 6. 论坛或博客迁移 7. 智能信息代理 8. 个人信息检索 9. 信息挖掘 有多个版本可以共享下载,下载完整工具箱,请访问:http:
chuizhisearch
- wangbo垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合;-wangbo vertical search engine that fully open-source version of one. front with Lucene search engine capabilities, all
collect
- 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度-Simple collection reptiles# 1. I have only had a collection of url feature, if y
webcrawler
- 一个java 开发的网络爬虫,采集功能比较强大-Development of a java web crawler, collecting more powerful features
Kcms
- 1、自动采集五大类内容:包括资讯、博文、问答、图片、视频;采集的内容来自不同的网站,不用担心搜索引擎的降权。 2、自动伪原创内容:自动对标题随机植入拼音、自动判断是否适合采集内容、自动对内容进行相关内容杂化以形成原创内容。作为一款聚合系统,我们不希望给您带来繁琐的操作,一切都在默认中智能化进行,您的任务就是建站、推广、赚钱。 -1, automatically collecting five categories: including information Bowen, quizzes
MetaSeeker-4.11.2
- 主要应用领域: • 垂直搜索(Vertical Search):也称为专业搜索,高速、海量和精确抓取是定题网络爬虫DataScraper的强项,每天24小时每周7天无人值守自主调度的周期性批量采集,加上断点续传和软件看门狗(Watch Dog),确保您高枕无忧 • 移动互联网:手机搜索、手机混搭(mashup)、移动社交网络、移动电子商务都离不开结构化的数据内容,DataScraper实时高效地 采集内容,输出富含语义元数据的XML格式的抓取结果文件,确保自动化