搜索资源列表
SQLET_spider
- 网络机器人又称为Spider程序,是一种专业的Bot程序。用于查找大量的Web页面。它从一个简单的Web页面上开始执行,然后通过其超链接在访问其他页面,如此反复理论上可以扫描互联网上的所有页面。-network robot also known as Spider procedures, is a professional bot procedures. Looking for a large number of Web pages. From a simple Web pages to beg
searchenginTuirial
- 搜索引擎原理、技术、实现,是非常好的入门书籍,我花了3天时间看完,讲得非常好-Search engine theory, technology, implementation is a very good entry-books, I spent 3 days to read, speak very good
SearchEngine
- 搭建一个简易的搜索引擎指引。附《搜索引擎原理与实践》源码。-To build a simple search engine guidelines. Attached to " search engine theory and practice" source.
SearchEngine-TheoryTechnologyAndSystem
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建 方案。从基本工作原理概述开始,到一个小型简单搜索引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及 其关键技术.-introducing the theory technology and plan of search engine.realizing large scale distributed search engine system.
how-to-use-C-toSpider
- 蜘蛛是一种半自动的程序,就象现实当中的蜘蛛在它的Web(蜘蛛网)上旅行一样,蜘蛛程序也按照类似的方式在Web链接织成的网上旅行。蜘蛛程序之所以是半自动的,是因为它总是需要一个初始链接(出发点),但此后的运行情况就要由它自己决定了,蜘蛛程序会扫描起始页面包含的链接,然后访问这些链接指向的页面,再分析和追踪那些页面包含的链接。从理论上看,最终蜘蛛程序会访问到Internet上的每一个页面,因为Internet上几乎每一个页面总是被其他或多或少的页面引用。-Spider is a semi-au
kgramjac
- 计算两个字符串的k-gram的jaccard系数,是信息检索理论判断两个字符串相似度的应用。-To calculate the jaccard value of the two strings, in terms of the k_gram theory.