资源列表
ch03
- ajax+lucene开发搜索引擎一书中源码第三章
Algorithm
- 搜索相关文件的附件,让我们的搜索更加简单方便。-Search file attachments, so that our search is more simple and convenient.
spider
- 网络搜索引擎的源代码,可以直接应用于APPLET
200473133848
- java语言编写的搜索引擎源代码,附说明文件-java language search engine source code, annotated document
search
- 一在线查单词的小工具`` 是用AUTO写的源程序`
HMM
- 这是一个HMM 隐马尔科夫算法,是属于自然语言处理的重要算法之一,本算法的精确度取决于词库-this is an HMM program
Simple-collection-of-reptiles
- 简易采集爬虫 # 1.我只做了一个收集url的功能,如果需要将数据入库,可在 parseData 函数里面写处理代码 # 2.需要sqlite3或者pysqlite支持 # 3.可以在DreamHost.com空间上面运行 # 4.可以修改User-Agent冒充搜索引擎蜘蛛 # 5.可以设置暂停的时间,控制采集速度- Simple collection of reptiles # 1 I just made a collection of URL functi
12spider
- 网络蜘蛛源码。 Spider是搜索引擎的一个自动程序。它的作用是访问互联网上的html网页 ,建立索引数据库,使用户能在搜索引擎中搜索到贵网站的网页。 搜索引擎 派出“蜘蛛”程序检索现有网站一定IP地址范围内的新网站,而对现有网 站的更新则根据该网站的等级不同有快慢之分。一般来说,网站网页等级 越高,更新的频率就越快。搜索引擎的“蜘蛛”同一天会对某些网站或同 一网页进行多次爬行,知道蜘蛛的运动规律,对于更新网页、了解搜索引 擎收录的收录情况等等有相当重要的作用。-Spider-source ne
collect
- 从网上下下来的希望有用哦。。。搜索引擎。。。爬虫源码-Down from the Internet under the hope of useful Oh. . . Search engine. . . Reptiles source
soso
- 分词的源码。自己弄的一个小程序源码。大家一块学习。
SQLET_searcher
- SQLET WebServer 测试 一个C语言编写的搜索引擎,初学者接触搜索引擎学习资料。-SQLET WebServer testing a C language search engine, beginners contact search engine learning materials.
wordbag
- 根据一个人物名单文件,查找wekipedia上相应网页,读取网页文本,并统计每个人物在每个网页上出现的次数,最终形成word bag,人物500人,运行时间6分钟左右。-from a namelist making a word bag