搜索资源列表
freqt-0.22
- 最大频繁模式树算法,可以自动识别集合中频繁出现的模式,在网页信息抽取中可以区分主回帖-Maximal frequent pattern tree algorithm, can automatically identify frequent patterns set in the Web information extraction can be distinguished in the main Replies
http_fetcher-1.1.0.tar
- html的dom树解析程序,该方法可以作为网页信息抽取的基础算法-html in the dom tree parser, the method can be used as the basis for Web information extraction algorithms
TUSHU
- 图书信息查询系统,可以输入图书信息,并统计图书数目-试试带有自动翻译功能的新型浏览器。下载 Google Chrome 浏览器关闭翻译中文英语德语检测语言 英语中文(简体)日语 翻译文字或网页 图书信息查询系统,可以输入图书信息,并统计图书数目 请键入文字或网站地址,或者上传文档。 取消 Túshū xìnxī cháxún xìtǒng, kěyǐ shūrù túshū xìnxī, bìng tǒngjì túshū shùmùBook Information
l-weiwei-spiderman-master
- Spiderman 是一个基于微内核+插件式架构的网络蜘蛛,它的目标是通过简单的方法就能将复杂的目标网页信息抓取并解析为自己所需要的业务数据-Spiderman is based on a microkernel architecture+ plug-web spider, its goal is to be able to target the complex web of information to crawl and parse through a simple method for t