搜索资源列表
DictionaryService
- 在线字典,调用google字典. 在程序里输入单词,就可以自动搜索返回翻译内容-online dictionary
NetSpider
- 搜索引擎开发总结、搜索引擎开发总结搜索引擎开发总结-Summary of search engine development
Crawler_src_code
- 网页爬虫(也被称做蚂蚁或者蜘蛛)是一个自动抓取万维网中网页数据的程序.网页爬虫一般都是用于抓取大量的网页,为日后搜索引擎处理服务的.抓取的网页由一些专门的程序来建立索引(如:Lucene,DotLucene),加快搜索的速度.爬虫也可以作为链接检查器或者HTML代码校验器来提供一些服务.比较新的一种用法是用来检查E-mail地址,用来防止Trackback spam.-A web crawler (also known as a web spider or ant) is a program,
webSearch
- 迅龙中文Web搜索引擎核心代码 运行环境 Microsoft .NET Framework 2.0 C# 开发 注意:必需步骤 nSearch\xOcx\install.bat 加载分词组件 -迅龙中文Web搜索引擎核心代码
SearchEngine
- C#+Lucene.Net开发完成的一个自定义WEB搜索引擎,本项目实现了分词、模糊索引,加以Lucene.Net内部核心功能共同实现了搜索机制引擎-C#+ Lucene.Net developed a custom WEB search engine, the project achieved a sub-word, fuzzy indexing, Lucene.Net be the core function of the internal search mechanism to achie
CSharpSpider
- 能够实现基本的网络过滤功能 ,蜚地 模压时机时机,很重要,对于刚刚开始学习网络编程的同学来说。-Network to achieve the basic filtering, pressing time to time rumors, it is very important, who have just started to learn network programming for the students.
DictSeg
- Lucene的一个不错的分词组件,效果还不错,现在已经是1.4版本了-Lucene' s a good word components, the results were good, and is now 1.4 version of the
Blog_Engineer
- 博客搜索引擎,个人呕心沥血积累的c#源码,是个人学习、开发的好资料-Blog search engine, personal heart out accumulated c# source code, is a personal learning and development of good information
chuizhisearch
- wangbo垂直搜索引擎完全开源版 1.前台结合Lucene的搜索引擎功能,使得数据搜索更快; 2.新增加采集功能,采集时图片下载,flash下载功能,默认配置的是南海网分类信息的采集规则; 3.该代码简洁,完全开源,可以与网博多款新闻系统无缝整合;-wangbo vertical search engine that fully open-source version of one. front with Lucene search engine capabilities, all
TestSpider
- c#开发的蜘蛛程序源代码,编译后即可使用-c# development of spider program source code, compiled to use
QuickwebsearchengineC
- this is a faster search engine
search_engine_csharp
- 一个开源的搜索引擎程序,C编写的
33753115ktdictseg_v1.0.01
- 中文分词算法,效率很高,使用词典树装搜索进行单词切割,并提供扩充词库的函数-It s an arithmetc of word segment,it has a very high efficiency!
SharpICTCLAS
- ICTCLAS分词的总体流程包括:1)初步分词;2)词性标注;3)人名、地名识别;4)重新分词;5)重新词性标注这五步。就第一步分词而言,又细分成:1)原子切分;2)找出原子之间所有可能的组词方案;3)N-最短路径中文词语粗分三步。 在所有内容中,词典库的读取是最基本的功能。ICTCLAS中词典存放在Data目录中,常用的词典包括coreDict.dct(词典库)、BigramDict.dct(词与词间的关联库)、nr.dct(人名库)、ns.dct(地名库)、tr.dct(翻译人名库
ICTCLAS2010CSharpDemo
- 中文分词源程序, 中文词法分析是中文信息处理的基础与关键。中国科学院计算技术研究所在多年研究工作积累的基础上,研制出了汉语词法分析系统ICTCLAS(Institute of Computing Technology, Chinese Lexical Analysis System),主要功能包括中文分词;词性标注;命名实体识别;新词识别;同时支持用户词典。我们先后精心打造五年,内核升级6次,目前已经升级到了ICTCLAS3.0。ICTCLAS3.0分词速度单机996KB/s,分词精度98.45
KSEngine
- 搜索引擎C#源代码,亲情奉献,呕血力作啊!!能正常运行,正常调试,有抓网页,分析网页,等技术在里面,如果有其他什么问题联系我email(k.liuxu@gmail.com)-The search engine code
CSharpSpider
- "蜘蛛"(Spider)是Internet上一種很有用的程序,搜索引擎利用蜘蛛程序將Web頁面收集到數據庫,企業利用蜘蛛程序監視競爭對手的網站並跟蹤變動,個人用戶用蜘蛛程序下載Web頁面以便脫機使用,開發者利用蜘蛛程序掃瞄自己的Web檢查無效的鏈接……對於不同的用戶,蜘蛛程序有不同的用途。那麼,蜘蛛程序到底是怎樣工作的呢? 本文介紹如何用C#語言構造一個蜘蛛程序,它能夠把整個網站的內容下載到某個指定的目錄,程序的運行界面如圖一。你可以方便地利用本文提供的幾個核心類構造出自己的蜘蛛程序。 -
mySegment
- 类库程序,基于词典的简单分词,可分中英文混合的情况-Simple dictionary-based segmentation procedure
cSharp-crawler-
- C# 编写的网络爬虫,比较基础 适合初学者入门学习,含代码,可运行-Web crawler written in C#, more suitable for beginner to learn basic, containing the code, run