资源列表
siena-java-2.0.3.tar
- 一款基于内容进行路由的发布订阅系统,用java实现的。-A content-based routing publish-and-subscribe system, implemented using java.
apache-tika-0.1-incubating-src.tar
- apache基金项目tika,是一个可以对内容进行分析、提取的开发包,结合正则开发包,可以开发基于垂直搜索引擎,目前正处于孵化阶段,这里是目前的最新版本
BlueLeech_v0.5
- 一个网络爬虫,当然是开源的,可以在网上找到相关资料-an spider for web
google_hacker.pdf
- google黑客揭密,用google侵入系统-google hackers Unmasked, using google invasive system
yuaisousuo
- 全自动抓取百度热搜榜,和百度或者好搜的搜索结果,支持只搜索某个站点 强大的扩展功能,可以让搜索指定关键词指定网站排名第几,还可以根据关键词显示不同的广告和指定HTML内容。可以轻松做出很多的web小应用,例如搜索:万年历 、计算器 、 天气 或搜索IP:183.240.197.171 完全自定义伪静态规则,让URL更漂亮 强大开放的Sitemap功能,轻轻松松做出数百万页面的网站地图 搜索结果统一排序功能让你的搜索引擎与众不同 PC+WAP自动识别,让移动搜索引擎收录更好(Fully
外链工具
- 提升链接曝光率,发布SEO外链,5000条外链可发布(Improve link exposure, release SEO external links, 5000 external links can be published)
parker.rar
- 一个FTP搜索引擎,CGI界面、后台自动更新数据。运行在linux等标准Unix。
parker.rar
- 一个FTP搜索引擎,CGI界面、后台自动更新数据。运行在linux等标准Unix。,A FTP search engine, CGI interface, the background to automatically update data. Running on linux standard Unix.
SimilarityRelationsInConcept
- 这是一篇关于搜索引擎领域中的关键词查询的文章,文章是国外技术文档-This is an article about the field of search engine keyword query article are foreign technical documentation
GoogleFileSystem
- We have designed and implemented the Google File System, a scalable distributed file system for large distributed data-intensive applications.
zl
- 搜索引擎多个打包学习资料,主要介绍了当前的一些方向性问题
RMM
- 这个是RMM算法,支持正向、逆向最大匹配,是自然语言处理的重要算法之一,只要替代程序中的词库即可。本词库取自1988年人民日报语料材料,算法对中文分词精确度达到90 以上-This is RMM algorithm supports forward, reverse maximum matching, natural language processing algorithm, as long as the alternative procedures thesaurus can. The th