资源列表
ir
- 基于网页的倒排文件建立及查找 附源码及报告说明-Find attached source code and report illustrates web-based inverted file
KTDictSeg_v1.2.02
- KTDictSeg 一种简单快速准确的中文分词方法
lucene-demos-2.9.1.jar
- 一个基于Luncene做的搜索引擎开发包-Do a search engine based on Luncene Development Kit
trafic_inquirement
- (1)提供对城市信息进行编辑的功能。 (2)城市与城市有两种交通工具,提供对列车时刻表和飞机航班进行那个编辑的功能。 (3)在全程只考虑一种交通工具的前提下,提供三种最优策略:最省钱、最快捷、或者换乘次数最少。 (4)由用户输入起始站、终点站、最优决策原则和交通工具,输出相应搜索结果。 -(1) to provide information on the city editor functions. (2) There are two cities and urban trans
query_click_distribution
- 一个处理搜索引擎中的用户搜索词相关的url点击数据的程序,用来分析query是informational还是navigational。-A deal with search engine users search for words related to the procedure url click data to analyze query is informational or navigational.
fenci
- 一个简单的基于词典分词的程序,lucene的分词程序不少,但有时候并不需要复杂的功能,只是需要简单的根据指定的词典分词。代码简单,可以作为学习参考-A simple dictionary-based word process, lucene procedures for sub-word a lot, but sometimes does not require complex functions, but only require a simple dictionary word accord
WebCrawler
- 一款利用WebBrowser的网络爬虫,适合初学者-A network crawler using WebBrowser , suitable for beginners
HZ_Freq
- java中文分词系统,可供大家学习,祝成功路上越走越远!-Java wordseg program
ANN
- ANN是一个加快搜索速度的源码程序;通过C++编写,支持在任意高维空间的近似或准确的最近邻搜索。
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
ishionseotool
- seo工具大全,PR查询 Google收录 Baidu收录 Yisou收录查询 Alexa排名查询-seo tools Daquan, Google PR inquiries included Baidu included Yisou included inquiries Alexa ranking inquiries
openv_classic_definition_video_source_search_syste
- openv高清影视搜索系统经典源码openv classic definition video source search system-openv classic definition video source search system