资源列表
collect
- 从网上下下来的希望有用哦。。。搜索引擎。。。爬虫源码-Down from the Internet under the hope of useful Oh. . . Search engine. . . Reptiles source
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
Simple-collection-of-reptiles
- 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just made a collection of URL functi
HMM
- 这是一个HMM 隐马尔科夫算法,是属于自然语言处理的重要算法之一,本算法的精确度取决于词库-this is an HMM program
search
- 一在线查单词的小工具`` 是用AUTO写的源程序`
200473133848
- java语言编写的搜索引擎源代码,附说明文件-java language search engine source code, annotated document
spider
- 网络搜索引擎的源代码,可以直接应用于APPLET
Algorithm
- 搜索相关文件的附件,让我们的搜索更加简单方便。-Search file attachments, so that our search is more simple and convenient.
ch03
- ajax+lucene开发搜索引擎一书中源码第三章
jasearch
- 简单的全路径全文搜索的程序 -Simple all path and text search a
similarity.文本相似度计算余弦相似度代码
- 文本相似度计算余弦相似度代码,计算文本相似度,用于搜索引擎,Cosine similarity of text similarity computation code, the text of the similarity calculation for the search engine
04799160weblogdig
- c++写的非常好的搜索引擎代码,值得学习借鉴-c++ to write a very good search engine code, it is worth to learn from