搜索资源列表
wordRecognition
- 文字识别的一种方法,不准确,仅供参考。 主要内容:界面,提取任意字点阵,识别。 环境ubuntu + eclipse + java-An approach to word recognition (Chinese). Content: UI, getting the dot metrix, recognition. Environment: ubuntu+ eclipse+ java
zb8
- 1、无限级多页采集,可以实现无限深度的采集 2、任务队列运行管理,支持Cron表达式 3、无限级分组任务管理,任务回收站功能 4、RSS地址采集功能 5、列表页分页采集获取功能 6、列表页附加参数获取功能 7、列表页及标签XPath可视化提取功能 8、标签纯正则替换功能 9、Http接口查看运行情况 10、导出记录为单个或多个Txt、html 文件 11、标签间自由组合功能 12、针对标签内容继续发送Http请求功能 13、无限级列表网址采集
网店工商信息图片文字提取
- java图片识别文字java文字识别程序的关键是寻找一个可以调用的OCR引擎。tesseract-ocr就是一个这样的OCR引擎,(Java picture recognition text)