资源列表
56
- 多线程文件搜索,需要的朋友可以下载下来看看,学习学习-Multi-threaded file search, necessary friends can download them to see, study study
spider
- 网络爬虫程序、针对主流新闻网站进行信息抽取-Web crawlers for information extraction mainstream news sites
知网爬虫
- 自己写的一个关于python的小型爬虫,性能感觉还算可以。(Himself wrote a small crawler about python, performance feel return calculate can.)
189
- 图书馆的基本功能,可以搜索书本,书本编号,查找作者-The basic function of libraries
07Crawler
- 这是一个网络爬虫的程序,只是能爬取网页,比较适合初学者学习用。-This is a network Reptile procedures, but will climb from the website, more suitable for beginners to learn from.
IP
- vc++实现的搜索局域网在线主机的程序,Socket编程-vc++ implementation of the search procedure for a host on the LAN
spider2006
- 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等。 -C# spider.
2005202sou
- 可以查看你的网站在搜索引擎搜索关键中排第几名,可以在数十个搜索引擎中快速找到你网站的位置,含ASP版和ASP+ASP.net两个版本 -can check your website in search engine key ranked number, the number of 10 quick search engine to find your site location, including ASP and ASP version ASP.net 2 version
ChineseSegment
- 基于Hash字库算法的lucene分词 完整的代码,使用创新的Hash字库,是分词效果大大提高
SEO
- 搜索引擎优化 通向成功十步 这个文档是通向SEO的一步 SEO,学会了就不用去担心程序员不好找工作了。-search engine optimization leading to the successful 10-step documentation is a step towards SEO SEO, learned not worried spent programmers not easy to find work.
goodluck
- 谷歌小工具,可以测试幸运指数,,简单有趣-one,tools
cjbt
- 1.BT下载页和种子列表以及搜索列表页均采用伪静态化URL,更易于被搜索引擎收录。 2.内置百度的热门电影、电视剧、动漫卡通、软件等TOP50关键字排行小偷. 3.强大的BT搜索功能. 4.可以在Linux和windows等系统服务器上正常运行。 5.除去了一些不必要的代码,提高了程序运行效率。 6.BT数据同步更新程序,每天更新几百条BT种子 7.任意自定义添加广告(请自行修改www文件夹下的文件) 8.高速获取数据,无需维护管理,一分钟即可建立个性化的BT站点!