搜索资源列表
Crawler_bemjh
- 用为为教育黄页网站提供数据的主题工蜘蛛,这个蜘蛛只下载与教育相关的网页,过滤掉一些不相关的网页,其中有重要的评分部分,很实用,稍加改动就可用于各种主题的蜘蛛.-use of the Search for Education website to provide data for the theme of spiders, The spider only download to education-related website, filtering out some not related to
SearchEngine
- 搜索引擎模块是一个很主要且常见的功能。一个好的搜索引擎能给用户使用带来方便。在“站内”选项卡下的搜索框中输入欲查询的关键词,如“PHP 字符串,处理技术!”,单击“极速搜索”按钮,系统会首先过滤欲查询关键词的标点符号,然后对过滤标点符号的关键词进行分词操作,接下来在数据库中检索与之匹配的信息资源。同时实现搜索计时及查询结果汇总功能,并在结果集中高亮显示查询关键词,最后以分页形式输出匹配结果给用户。-Search engine module is one of the main and commo
CSharpSpider
- 能够实现基本的网络过滤功能 ,蜚地 模压时机时机,很重要,对于刚刚开始学习网络编程的同学来说。-Network to achieve the basic filtering, pressing time to time rumors, it is very important, who have just started to learn network programming for the students.
SmartSOSO
- 智能搜索引擎(Smart Hunter) 是根据目前搜索 引擎的发展趋势,除提供传统的全网快速检索、相关度排序等功能外,还提供用户角色登记、 用户兴趣自动识别、内容的语义理解、智能化信息过滤和推送等功能,为用户提供一个真正 个性化、智能化的网络信息搜集工具-Intelligent Search Engine (Smart Hunter) are based on current trends the search engine, in addition to providing tr
Manning.Lucene.in.Action
- Lucene是一个开源世界瑰宝- 高度可扩展的,快速的搜索引擎。它提供的性能,是disarmingly易于使用。在行动Lucene是Lucene的权威指南。它描述了如何索引你的类型,包括你一定要知道,如MS Word,PDF格式,HTML和XML数据。它向您介绍了搜索,排序,筛选,突出搜索结果。 -Lucene is a gem in the open-source world--a highly scalable, fast search engine. It delivers perfo
ProgrammingPCollectivePIntelligence
- 本书以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析Web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从Web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数据子集)、搜索引擎核心技术(爬虫、索引、查询引擎、PageRank算法等)、搜索海量信息并进行分析统计得出结论的优化算法、贝叶斯过滤技术(垃圾邮件过滤、文本过
ZhuaQu
- JAVA实现基本的页面抓取,运用多线程过滤和筛选,网络爬虫-JAVA Implementation of the basic page capture, filtering and screening of the use of multi-threaded Web crawler
Hyperion
- 一款开源的桌面搜索引擎源代码,技术特色包括快速搜索文件(作者称经常会少于1秒),支持音乐/文档/图片筛选过滤,文件类型筛选过滤,文件访问和文件大小筛选等-An open source desktop search engine source code, technical features include a quick search for files (that are often less than one second), support the music/document/image
cofe
- 基于协同过滤推荐recommendation的电影推荐系统源码-Movie recommendation based on collaborative filtering recommender system source code