搜索资源列表
lzsearch
- 用javascrip编写的分词系统 可以解决现在许多网站中文搜索支持不好的问题 无解压密码 -javascrip prepared with the sub-term system can solve many Web sites now support Chinese search the problems without extracting passwords
中文搜索引擎技术揭密:系统架构
- 中文搜索引擎技术揭密,简单介绍了搜索的相关知识和原理。-Chinese search engine technology to conduct a brief introduction to a search of relevant knowledge and principle.
20040409baidu
- 老独搜索 (Ver 1.0 build 20040127) 你以为这是百度?错,这只是老独!无需管理的搜索站,本程序和全球中文搜索门户网站baidu.com同步更新,一次安装,无需维护;本程序模仿baidu的风格界面,欢迎各位朋友开发出其他风格的skin! -old independence search (Ver 1.0 build 20040127) You thought it was Baidu? Right or wrong, this just old alone!
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
lz_spidetytryryr
- 这个系统是属于自动化的搜索引擎,它可以从一个网址列表开始,自动寻找这些网址的下一级网页。可以让中小网站也有有自己特色的搜索引擎。 适合与于对某一指定领域里的网站进行搜索,比如仅搜索医学网站。 使用sql server 2000做数据库。 网络蜘蛛根据用户设定的入口网址自动收集网页数据 强大完备的后台管理 充分挖掘.net性能,百万数据瞬间搜索 完美的前台web页cc面媲美专业搜索 中文分词接口-The system is an automated search
lucene_cn
- lucene中文搜索包,用于构建搜索 Lucene不是一个完整的全文索引应用,而是是一个用Java写的全文索引引擎工具包,它可以方便的嵌入到各种应用中实现针对应用的全文索引/检索功能。 Lucene的作者:Lucene的贡献者Doug Cutting是一位资深全文索引/检索专家,曾经是V-Twin搜索引擎(Apple的Copland操作系统的成就之一)的主要开发者,后在Excite担任高级系统架构设计师,目前从事于一些INTERNET底层架构的研究。他贡献出的Lucene的目标是为
zwfcxt
- 中文分词系统最完整库,有志向做搜索的朋友可以参考一下,非常有价值的资料-Chinese word segmentation system for the most complete and aspirations so friends can search reference. Very valuable information
SearchEngineCore
- 搜索引挚内核 SearchKernel.ocx控件被加载过10万个以上不同地址,通过了稳定性测试. 在VC, VB, Office, Web页上分别测试通过. SeKel.h是控件的接口说明. test目录中是控制的调用源代码. 控件内置多线程下载. 内置html完全解释.(解释了90%左右html脚本, 容错控制采用仿ie的技术) 内置javascrip有限解释.(解释了基本循环, 字符操作运算和整型运算) 内置正文分析的分解.(只仅中文简体)
theory_of_search_engine
- 本书比较系统地介绍了互联网搜索引擎的工作原理、实现技术及其系统构建 方案。全书分三篇共13章内容,从基本工作原理概述开始,到一个小型简单搜索 引擎实现的具体细节,进而详细讨论了大规模分布式搜索引擎系统的设计要点及 其关键技术;最后面向主题和个性化的Web信息服务,阐述了中文网页自动分类 等技术及其应用。本书层次分明,由浅入深;既有深入的理论分析,也有大量的 实验数据,具有学习和实用双重意义。
Uindex.Src
- Uindex是一个开放源代码的搜索引擎,网页搜索量定位在千万量级,目前提供从蜘蛛程序、中文分词到建立全文索引的全部工具程序,FTP搜索提供基于文件名的检索,支持常见的FTP服务器。
Project1(local)
- 完成最基本功能的本地简易字符串搜索(文本匹配)引擎,还不支持对中文的检索
Project1(soap)
- 采用SOAP协议的简单文本搜索引擎,可在客户端向服务器端发出请求,并进而在服务器端的文本文件中查询特定字符串,目前还不能支持中文搜索。
BeeCollector
- * BeeCollector,中文全称为“小蜜蜂采集器”,以下简称BC; * 欢迎使用不受目标语言限制、不选存储对象数据库的在线采集器,Google、Baidu搜索排名第一,完全免费,放心使用。 * 在您开始使用之前,请务必完整阅读本软件附带的全部说明档 * 您目前所使用的版本 V1.1031 06.10.31 19:52
SearchEngine
- 1.这是一个简单的采用了Lucene的搜索引擎,本例子采用lucene+struts+ibatis的框架进行开发,使用的数据库是Oracle,搜索源是jpetstore的product表,大家在使用的时候请根据实际情况修改database.properties文件的配置。 2.本例子支持中文搜索,相关的源码包在cnSolution目录。
javaSearch
- 目录 目录 1 摘要 3 第一章 引言 4 第二章 搜索引擎的结构 5 2.1系统概述 5 2.2搜索引擎的构成 5 2.2.1网络机器人 5 2.2.2索引与搜索 5 2.2.3 Web服务器 6 2.3搜索引擎的主要指标及分析 6 2.4小节 6 第三章 网络机器人 7 3.1什么是网络机器人 7 3.2网络机器人的结构分析 7 3.2.1如何解析HTML 7 3.2.2 Spider程序结构 8 3.2.3如何构造Spid
textprocess
- 中文搜索源代码,对论文数据库基于主题和摘要的搜索-Chinese search source code, based on the theme of the thesis and a summary of the database search
ftpsearchengine
- 软件名称:BISM "菁搜" FTP搜索引擎 软件版本:V1.0 见议分类:网络软件-> 搜索引擎 联系EMAIL:BISM软件工作组 E-MAIL:Bismsotware@163.com 余文锋 E-MAIL:wenfeng610@yahoo.com.cn 陈鸿雏 E-MAIL:canzer@126.com.cn 吴侃侃 E-MAIL:suzerain2005@163.com 软件网站:http://blog.csdn.net
src
- 利用lucene编写的一个简单搜索引擎,能够中文分词。-a simple search engine built with lucene.
SphinxV0.9.8.1source
- SphinxV0.9.8.1source.zip VC++ 基于Lucene扩展的支持中文分词的开源搜索引擎 中文用户-Sphinx V0.9.8.1 source.zip VC++ extensions to support Lucene-based Chinese word segmentation in Chinese open source search engine users
33753115ktdictseg_v1.0.01
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数-It s an arithmetc of word segment,it has a very high efficiency!