CDN加速镜像 | 设为首页 | 加入收藏夹
当前位置: 首页 资源下载 源码下载 多媒体 搜索资源 - 抓取网页爬虫

搜索资源列表

  1. usdsi

    1下载:
  2. 本程序是用python编写,无需安装。运行Crawler.exe就可以看到效果。 如果不修改配置是抓取新浪科技的内容,修改配置可以抓取指定的网站。 配置文件采用ini的格式. spider_config.ini蜘蛛的配置 1. maxThreads 爬虫的线程数 2. startURL 爬虫开始的URL 3. checkFilter 爬虫只抓取指定的URL(采用正则表达式匹配) 4. urlFilter 爬虫提供给分析器的URL(采用正则表达式匹配) sucker
  3. 所属分类:视频捕捉/采集

    • 发布日期:2008-10-13
    • 文件大小:1.23mb
    • 提供者:文君
搜珍网 www.dssz.com