资源列表
LuceneInActionSRC.tar
- 搜索引擎Lucene的一本书的源码,对于看那本书确实很有帮助-Lucene search engine, a source book for Look at this book really helpful
1
- web page classification
2
- web page classification
bamboo.v.1
- 该程序从网页的特征出发,利用简单的规则方法,却能够达到较好的效果。-The characteristics of the program starting from a web page, using simple rules of method, they can achieve better results.
search.class
- 文本搜索类,支持全文搜索及关键字高亮显示,搜索结果类似百度的搜索结果-a class of text search,which support all text search and highlighting keywords,the result looks like the result of BAIDU
T1
- Visual Basic 作品 网络搜索引擎 -seaching engineer web tools in visual basic
RMM
- 搜索引擎返回结果的自动文摘研究中分词源代码-Research on Automatic Abstraction Based on Search Engine Result
luceneCH2
- 亲自测试成功的《开发自己的搜索引擎》第二章,以及一个分词器的测试程序。-Personally successfully tested a " to develop its own search engine" second chapter, as well as a word breaker testing procedures.
dos
- DOS 全部常用命令集,可以搜索查看,用起来十分方便-DOS all the common command set, you can search view, is very convenient to use them
collect
- 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度-Simple collection reptiles# 1. I have only had a collection of url feature, if y
google-blog-CodePub.tar
- Google “解放数据”(Data Liberation)团队今天正式发布 Google Blog Converters 1.0,该开源工具可以让你在不同博客服务之间自由转移文章和评论数据。第一个版本提供了 Python 程序库及相关可执行脚本,用于相互转换 Blogger、LiveJournal、MovableType 和 WordPress 导出的各种数据文件格式。-Google " the liberation of Data" (Data Liberation) te
iokvo
- 一个实用的元搜索引擎源代码,希望有帮助大家学习。