资源列表
sphinx-egypt-2007
- sphinx-egypt-2007开源搜索引擎-sphinx-egypt-2007 open-source search engine
aa
- 基于支持向量机与无监督聚类相结合的中文网页分类器,好文章-un supervised clustering algo rithm
zhuomiansousuoyinqing
- 桌面搜索引擎用于搜索本机硬盘内各文件或者文件夹,并输出结果。-Desktop search engine used to search the hard drive of each file or folder, and output.
okncym
- 爬行蜘蛛 自动去访问好友的好友,这样别人就会回访我的空间 ,zjein蜘蛛,qq种菜分析工具-Crawling spider to visit friends of friends automatically, so that people will pay a return visit to my space, zjein spiders, qq vegetables and analysis tools
esou
- 整合了目前比较流行的各大搜索引擎的功能,按网页、音乐、视频、游戏、下载、商业、黄页、字典等功能进行分类。重要的是针对Google和百度、sogou等搜索联盟赚钱提供了软件端口。用户下载后只需将注册的代码输入系统即可开始赚钱。 新版本还将整合网址导航站等实用功能给大家。-Integration of the more popular features in major search engines, according to web pages, music, video, games, do
TDHCursorFactory
- 是一个使用Perl语言编写的一个开源文本挖掘的程序。其中涉及了众多文本挖掘的技术,如文本聚类、分词、索引,搜索引擎、字典等等。-Perl is a language to use an open source text mining process. Involving a large number of text mining technologies, such as text clustering, segmentation, indexing, search engines, dicti
wget
- 批量下载论坛源码的工具,使用请搜索相关的网页-Batch Download Forum-source tools, use the search for relevant pages
p-0422--Simple_Search_Engine
- a simple search engine
CourseCrawler_1_0_0_final
- 搜索专业术语的爬虫,指定专业网站的列表从中搜索专业术语相关的网页。-search of the reptile's terms, the designated professional websites from the list of search terms related to the professional website.
NWebCrawler
- 网络爬虫, * 可配置:线程数、线程等待时间,连接超时时间,可爬取文件类型和优先级、下载目录等。 * 状态栏显示统计信息:排入队列URL数,已下载文件数,已下载总字节数,CPU使用率和可用内存等。 * 有偏好的爬虫:可针对爬取的资源类型设置不同的优先级。 * 健壮性:十几项URL正规化策略以排除冗余下载、爬虫陷阱避免策略的使用等、多种策略以解析相对路径等。 * 较好的性能:基于正则表达式的页面解析、适度加锁、维持HTTP连接等。-Web crawler
Introduction-IR
- 信息检索简介ppt
searchsheet
- 搜索芯片的软件。以方便搜集芯片资料来学习和使用相应芯片。-Search-chip software. To facilitate the collection of information to learn and use the chip, the corresponding chip.