资源列表
soo_search
- soo search是一个服务的接口,目标为简化搜索引擎的定制规则,加速全文索引的快速高效的开发。通过javaBean技术,把资源对象化,以建立方便的资源管理机制。soosoo search把资源的输入和输出通过一个值对象(bean)和用户进行交互,这样soosoo search可以快速的和现有的j2ee开源框架进行集成。soosoo search提供了两个接口,一个是索引器接口,一个是检索器接口。而这里两个接口的实现都是通过公共的数据模板进行资源的格式化。利用用户定制的javaBean对象,把
Search_Search_Engine_Overview
- 关于搜索引擎的一份优秀报告,包括搜索引擎的架构剖析,目前的应用以及所需解决的问题,文章来源于微软亚洲研究院-On a good search engine, including search engines analyze the structure, the current application and the necessary issues, the article comes from Microsoft Research Asia
SogouW.20061127
- 互联网词库来自于对SOGOU搜索引擎所索引到的中文互联网语料的统计分析,统计所进行的时间是2006年10月,涉及到的互联网语料规模在1亿页面以上。统计出的词条数约为15万条高频词,除标出这部分词条的词频信息之外,还标出了常用的词性信息。 语料库统计的意义:反映了互联网中文语言环境中的词频、词性情况。 应用案例:中文词性标注、词频分析等。 词性分类: N 名词 V 动词 ADJ 形容词 ADV 副词 CLAS 量词 ECHO 拟声词
Google_Advanced_tips
- google的使用技巧,新入手的同志们似乎好多还不知道google的强大……再次可以看到一点-google using techniques, the new seems to start with a lot of comrades who do not know the power of google ... ... you can see that once again
seobookCN
- seobook中文版_完全解除限制.<SEOBOOK> 国外的一本经典之作,专业人士称之为 “ SEO 圣经 ” 可想此本 著作在行业内的影响力。他不是教你用何种作弊手段欺骗搜索引擎,而是给你 一 种正确的方法,让你走一条站点优化的康庄大道。将你引向网络营销的成功巅 峰!-<SEOBOOK> Abroad for a classic, professionals call it " SEO Bible" may want this book in
求助网系统(仿爱问、类似知道) v4.0 html完整版
- 一问多人参与,评论,分享DIGG 多种模式于一体系统,更多好的功能请站长们自己体会吧!
luceneCH2
- 亲自测试成功的《开发自己的搜索引擎》第二章,以及一个分词器的测试程序。-Personally successfully tested a " to develop its own search engine" second chapter, as well as a word breaker testing procedures.
C_spider
- C写的网络蜘蛛程序,里面包含了一些源代码!-C write spider network!
java_webspider
- java实现的网络爬虫,可以生成节点图,非常强大,也很好用。-java implementation of the Web crawler can generate a graph of nodes, very powerful, just as well.
Web_Crawler
- 网络爬虫的实现及其它的原代码,从网络上抓取网页-Web crawler implementations and other source code, web pages crawled from the web
SearchEngineOverview_Ji-RongWen
- 搜索引擎的相关资料,详细讲述了搜索引擎的基本原理和所遇问题。