搜索资源列表
风车采集器
- 1、采用asp.net开发,运行于IIS下。 2、可根据入库设置,自动挂接到现有的网站系统,与现有系统实现无缝集成,补充或替换现有系统的采集程序。 3、采集调度,即计划任务,可为每个采集规则设定时间定时重复采集,多个采集任务可同时运行,到了设定时间采集程序在Web服务器后台自动执行,真正实现了无须人工干预的自动更新。 4、可自动归类,对采集的信息实现自动分类,当目标分类不存在时可自动创建该分类,也可通过分类映射将目标分类与当前网站内容分类进行合并。无需为每个类别建立一个采集任务。
网页搜索引擎
- K-PageSearch是由Kwindsoft在2007年自主研发的专为行业、专类信息检索设计的网页搜索引擎。主要功能特点:网络蜘蛛、定向采集、正文提取、中文分词、全文索引、相关度排序、网页快照、相关搜索、竞价排名;后台数据库采用Microsoft SQL Server,静态化搜索系统设计采用XML数据岛缓存搜索结果提高系统的稳定性和性能、节省服务器资源减轻系统负担。 网络蜘蛛 K风蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页扫描; 自动识别GB2312、BIG5、UTF-8、Unic
自动新闻采集与发布系统
- 自动新闻采集与发布系统。可以自动下载新闻网页,并进行分析,抽取新闻,crawler the news auto and public
123.rar
- 网站数据采集工具 表单登录 网页分析 论坛发贴,Web form data collection tools registry web analytics forum
delphi 2010 webpage Harvest
- web网页采集主要用于网址提取,内容提取,图片提取,网页源码。 用于网页分析的delphi源代码,可以提取网页中的连接、图片、内容等。 源代码非常简单,便于分析。 -get website page url,content ,pic and source code。
Codejia.com_58bd1662703f4f56ae251d04561a3709
- 一个完整的网页采集系统源码,是对网页数据采集不错的资料-A complete web page source code acquisition system is a good information web data collection
iwms4.6
- 主要功能: ·集成讨论区,可作为留言版或简易论坛 ·首页、 分类、新闻、专题可生成静态页面 ·生成速度可在每分钟30页到2000页之间选择 ·首页静态文件自动定时生成 ·新闻采集功能,采集时可进行其它管理操作,采集规则导入导出 ·多任务循环采集采集,可实现网站24小时自动内容更新 ·采集支持utf-8和big5编码并能转换繁体为简体 ·新闻内其它网站图片与Flash自动下载 · jpg、gif、png、bmp图片自动加水印(水印图片及位置可设置
lzzSearch-1.01
- 网页采集系统 === === ===== 安装配置 --- - 1 程序我就不说了 2 配置文件 applicationContext.xml 里面有详细的注释 3 已经包含了多个论坛博客的参数,如CSDN论坛、博客园、新浪博客、百度Hi、ccidnet等的解析参数 需要的类库 --------- 1 Spring 2.5 2 common-logging 1.1 3 paoding-analysis 2.0.4-beta
CMS4J_FREE_2008_B081122_J15
- 国人开发的一套java内容管理系统,功能包括网页信息采集、数据库采集 支付传统方式的网页信息采集,可以将其它站点的数据按照一定的规则采集到本系统中,而后可以进行方便的管理、利用、发布 除此之外,CMS4J还支持“数据库”的采集,即可以将一个其它系统数据库中的数据按照一定的规则... -Magnolia CMS is a free, open source, J2EE configuration content management system. Functions include inform
fypc
- 新闻采集系统可以将网络上的任务新闻采集到本地生成文件保存。 并可以根据您提供的网页模板批量的生成新闻html文件并上传到您的服务器上 而且将数据同步写入您的数据库。-News-gathering system on the network can be news-gathering mission to save the file locally generated. And can provide you with the bulk of the generated web pa
text
- 网站网页源代码采集数据工具..ADO链接ACCESS数据库-Web page data collection tool for source code links to ACCESS database .. ADO
wycj
- Java语言程序源码,网页采集系统,欢迎大家使用-Java language program source code, web pages collection system, welcome to use the
gethouse_inf
- 用http协议实现网页浏览并采集信息,本程序对固定发布的房产信息网进行采集将最新资源存在在文件中-simple explorer
ydmdq
- 网页源代码查看器C#版.输入网址,即可获取该网址页的网页源代码,类似一个C#采集的雏形,再加上字符的相关处理入库就可轻易的变为一个采集软件,实用性还是很强的。-Web page source code viewer C# version. Enter the URL, you can get the web site page source code, similar to a C# collection of the prototype, together with the relevant
Collection1.0
- 一个简单的网页采集系统,是一个为初学者提供实现网页数据采集思路的源码,通过请求网页来抽取源码,并用正则表达式提取内容以及转换为XML格式遍历内容并存入Access数据库中。-A simple web collection system is available for beginners to achieve a web page source data collection ideas, through the request page to extract source code, and
Parse
- 网页采集:可以从任何类型的网站采集链接信息-Web Collection: You can collect from any type of website links to information
K-PageSearch
- 功能特点 多线程网络蜘蛛 网页定向采集 多语言网页编码自动识别 哈希表网页去重 智能网页正文抽取 基于词库的智能中文分词 中文分词词库管理 海量数据毫秒级全文检索 缓存技术 网页快照 高级搜索 竞价排名 网络蜘蛛-Features multi-threaded web spider web oriented multi-language Web page collection automatic identific
zz
- delphi取得网页源码,并使用正则表达式的源码,适合用来制作网页采集,网站采集的源码-delphi source code access page, and the source code using regular expressions, suitable for web pages collection, the source site collection
Zxq采集器源码
- 新闻采集,网页采集。asp.net简单三层结构的。(News gathering, web collection. Asp.net simple three layer structure.)
delphi7
- 网页采集之网址提取,内容提取,图片提取,网页源码(Web site extraction, content extraction, picture extraction, web source code)