搜索资源列表
求助网系统(仿爱问、类似知道) v4.0 html完整版
- 一问多人参与,评论,分享DIGG 多种模式于一体系统,更多好的功能请站长们自己体会吧!
Spideroo
- C#写的一个搜索引擎,可以搜索、建立索引等。building a simple search engine that crawls the file system from a specified folder, and indexing all HTML (or other types) of documents. A basic design and object model was developed as well as a query/results page-C# to write
一种实现中文HTML文档自动聚类的方法
- 让你的检索更精确——一种实现中文HTML文档自动聚类的方法-let you search more accurate -- A Chinese automatic HTML document clustering methods
SkypeClient
- 1、支持无限级分类,无限添加网站; 2、动态生成HTML网页文件; 3、动态生成静态搜索目录,大大减轻了服务器负担; 4、对每一个登录网站进行审核管理; 5、搜索关键词具有空格分别功能,例如:“电脑 游戏”搜索引擎会找出 关于“电脑”和“游戏”的网站; 6、方便使用的网页模板,随时做出您的个性化网页; 7、动态设置网站在搜索结果、分类目录里的排名排序; 8、可以设置登录的网站出现在多个不同分类目录上,而不需要多次登录-a support unlimited c
aspurl
- 后台管理,生成HTML...可以批量添加网址数据. 后台管理admin 123123 -management background, generate HTML ... can add site data volume. Background management admin 123123
PHPWindblog
- PHPWind大型多用户高速博客个人主页系统 PHPWind 推出大型多用户博客(BLOG), 该系统以众多个人日志(主页)为内容基础, 为网站内容管理与发布提供了更好的解决方案! (1) 以 .html 为链接模式架设整个网站, 让站点的内容大量出现在各大搜索引擎 (2) 全面支持 二级域名 比如 我的个人主页 http://yuling.phpwind.net (3) 做为一个可独立运行的系统, 同时可选择性的与论坛会员及文章数据进行完美整合! (4) 完全支持 RSS,
aspseek
- ASPSeek是一个C++编写的互联网搜索引擎,并使用了STL库。它主要包括一个检索机器人,一个搜索守护程序,和一个搜索前端(CGI或者是Apache模块)。它大概可以检索几百万个URLs,来查找给定的短语和单词,并使用通配符,进行布尔搜索。搜索结果可以限定在给定的时间或站点,站点空间,并按照相关性或者时间进行排序(这里面使用了一些非常酷的技术)。ASPSeek可以应用于很多语言和编码中(甚至包括多字节语言如中文)。它为多个站点做了优化。(多线程检索,同步DNS查询, 按站点将结果分组, Web
websearch14566
- HTML页面分析利器,可定制所需求的信息,通过直搜客理有的放矢获得海量的网络信息。-HTML pages analysis weapon, which can be customized to the needs of information, Direct Search through targeted customer Jimmy was a flood of Internet information.
turbo_cwcshop
- 系统搭建在Utility-Layer Framework之上 整个系统基于UTF8编码,全面国际化支持,适合任何语言 商城适合销售任何商品 顾客购物流程非常流畅,不产生阻塞感,有良好的购物体验 (Utility-Layer Framework特性之一) 支持注册和非注册用户购物 优良的缓存特性和特别的异步更新数据设计提供了大负载的支持 (Utility-Layer Framework特性之一) 对GOOGLE有最好的亲和度 - 通过独特的URL重写技术,对所有商品页面和
firtex_beta102_src
- FirteX介绍 功能: 支持增量索引,差量索引,多字段索引,提供了3种前向索引方式; 支持纯文本,HTML,PDF等文件格式; 提供快速中文分词; 从底层到高层,提供了多种索引访问接口,灵活自由地使用索引文件; 提供丰富的检索语法,支持多字段检索,日期范围检索,检索结果自定义排序等。 性能: 在Pentium 4 2.8G 2GRAM的机器上超过200Mb每分钟的索引速度 在近7G的索引文件(100G网页,11G纯文本的索引)上检索,仅使用十几M内存在数毫
htmlparser
- HTML的解析器,是Majestic-12分布式搜索引擎的一部分。作者Alex Chudnovsky, Majestic-12 Ltd (UK)。这个是3.0版本,性能经过多次优化,文档也比较全。也可以到http://www.majestic12.co.uk下载。-HTML parser, Majestic-12 distributed search engine part. Author Alex Chudnovsky, Majestic-12 Ltd (UK). This is versio
c-vi
- 实用网址2007 1:整体美化,优化后台 2:增加了常用邮箱无忧登陆栏 3:增加了数个二级频道,使你的网站在最短的时间内提升排名 4:修正了一些小的BUG 5:分类更加详细,更加人性化! 6:新增个人网址导航功能(特色); 7:使用论坛等外部数据库用户表功能; 安装方法: 1:将源码全部上传到网站空间,进入后台管理页面 2: 点击“网站信息管理”,修改其中的网站信息 3:点击“生成html管理”,生成网站页面 4:后台管理目录:admin/
SearchEngineCore
- 搜索引挚内核 SearchKernel.ocx控件被加载过10万个以上不同地址,通过了稳定性测试. 在VC, VB, Office, Web页上分别测试通过. SeKel.h是控件的接口说明. test目录中是控制的调用源代码. 控件内置多线程下载. 内置html完全解释.(解释了90%左右html脚本, 容错控制采用仿ie的技术) 内置javascrip有限解释.(解释了基本循环, 字符操作运算和整型运算) 内置正文分析的分解.(只仅中文简体)
jspider-src-0.5.0-dev
- 一个JAVA的网络爬虫源码,可以爬取包括PDF,DOC,HTML等内容,相当不错!-A JAVA source network reptiles can climb check, including PDF, DOC, HTML and other content, very good!
AnalyzerViewer_source
- Lucene.Net is a high performance Information Retrieval (IR) library, also known as a search engine library. Lucene.Net contains powerful APIs for creating full text indexes and implementing advanced and precise search technologies into your programs.
Robot
- 网上机器人(Robot)又被称作Spider、Worm或Random,核心目的是为获取在Internet上的信息。机器人利用主页中的超文本链接遍历Web,通过URL引用从一个HTML文档爬行到另一个HTML文档。网上机器人收集到的信息可有多种用途,如建立索引、HTML文件的验证、URL链接验证、获取更新信息、站点镜象等。 -Internet Robot (Robot) also known as Spider, Worm, or Random, the core objective is t
Crawler
- A mini crawler engine for html files. The application is written in Visual C++ with MFC.
joyhtml-0.2.2
- html正文提取,利用匹配来进行正文的抽取-html text extraction, the use of matching to carry out the extraction of the body
html
- 可隐藏域名与不隐藏域名的Html转向代码-Html steering code to hide the domain name and does not hide the domain name
150201129黄增强
- html就会关于u与vv的的冯绍峰绯闻绯闻器(htmlqfeeqrefewfeqweqewqewqe)