资源列表
BaiduReptile
- Python百度空间搬家工具. 使用方法: baidu = BaiduMove( fred , 百度空间ID ) baidu.articleToRSS( 生成文件名 ,生成文件切割数) 作者网站:www.fengsage.com-Baidu Space to move Python tools. To use: .... author: www.fengsage.com
1.RAR
- 搜索引擎一词在国内外因特网领域被广泛使用,然而他的含义却不尽相同。在美国搜索引擎通常指的是基于因特网的搜索引擎,他们通过网络机器人程序收集上千万到几亿个网页,并且每一个词都被搜索引擎索引,也就是我们说的全文检索。著名的因特网搜索引擎包括First Search、Google、HotBot等-Internet search engine is used in the field is widely used abroad, but his meaning is different. Of the
N-gram
- N-gram中文分词系统,通过前后项切分,计算概率,进而获得最佳的切分-N-gram Chinese segment,by FMM and RMM,we can Calculate the probabilities,then,we can get the best segment.
fenci
- 用C++写的一个分词算法,有需要的可以下来-Written in C++, a segmentation algorithm, we need to look down
textsearch
- 一个超快的文本搜索算法 searchi = search ignore case search = search case sensitive searchiw = search ignore case words only (e.g. words delimited by whitespace only, not words within words) searchw() = search case sensitive words only -Super
daolian_shoulu
- 九大搜索引擎收录查询包括:百度,Google,Yahoo,有道,搜狗,搜搜,Altavista,Alltheweb,必应,可以查询这些搜索引擎的收录情况及反向链接数量;以及查询Sogou Rank,PageRank,Alexa Rank-serch tool souce code!
reading_categorization
- 网页自动分类技术已经成为Web领域的一个研究热点。本章主要讨论如何应用有指导的机器学习方法实现大规模中文网页的自动分类,以及如何应用中文网页自动分类方法实现搜索引擎目录导航服务-Automatic classification of Web technology has become a hot topic in Web field. This chapter focuses on the application of machine learning methods are directed
200632121315799
- 这个程序可以在90多个搜索中引擎提交你的搜索 -This process can be more than 90 search engines submit your search
luceneDocument
- 这是学习Lucene的有力武器,刚刚接触搜索引擎的初学者可以参考此文档,内有示例和API文档说明-Lucene is a powerful weapon to learn, just access to search engines beginners can refer to this document, there are examples and API documentation shows
API_lucene3.0.0
- 最新的lucene3中文api,是了解lucene的最好的学习文档。-The latest lucene3 Chinese api, is to understand the best learning lucene document.
baidu
- 百度(baidu)分词算法分析 有关百度搜索的数据分析-baidu
Lucene.Net
- Lucene.Net DLL及相关应用,用于查询数据索引建立-Lucene.Net DLL