搜索资源列表
Word2DB
- 从word文档中提取数据,适用于电子文档向数据库存储的转换。-from word to extract data files, apply to electronic documents stored in the database to change.
dwtwatermark
- 图像先进行DWT一级分解,用两个不相关的伪随机序列分别代表水印信息中的0和1,潜入到小波分解后的LH和HL两个字图上。 注:整个算法分水印嵌入和水印提取两个部分。-images conduct a DWT decomposition, with two not related to the pseudo-random sequence representing the watermark of 0 and 1, sneaked into the wavelet decomposition o
PHP调用C# COM+
- C#写的提取WORD、EXCEL、PDF等文件文本COM+,PHP调用简单,NameTest("d:\\协同办公系统用户手册.doc"); echo $msg;
calculator
- 计算器设计(运用词法分析&语法分析方法):1、为每种可能识别出来的合法单词创建一个类,类的属性包括该单词的各别码及值。 2、构建异常类,以实现计算器的容错性能。 3、构建一个词法分析类,用之提取单词。 4、构建表达式中各单词间的优先关系表。 5、构建一个语法分析类,对表达式进行规约。此类调用词法类获取单词,查询优先关系表进行规约操作。 6、构建一个计算类,调用语法分析类以实现计算。 7、构建一个GUI类,设计好操作界面,并内置计算类,以实现界面操作计算功能。 -Cal
lucene-2.9.0-src
- lucene-2.9.0-src.zip搜索引擎源码。 一种全文检索引擎 应该说是“可以配合字典分词,提取关键字”,而不是必须 配合字典的话会有较强的专业性和精度 -lucene-2.9.0-src.zip search engine source code. Of a full-text search engine should say " can match a dictionary word, extract keywords," rather th
zhengdike
- (个人原创)《中文网页自动分类》 牵扯的技术有:分词,统计词频,踢出网页中一些特殊字符(用正则表达式),还有需要提取培训集等等!! 此软件禁止商业活动,版权所属“qyTT论坛--www.qyclass.org/bbs” 本文来自: qyTT论坛 http://www.qyclass.org/bbs 我们的使命:让世界认识qyTT,让qyTT认识世界! 结果分析的思想:就是把得到的词频与建立的词库里每一类进行比较,如果存在一个最大匹配程度,就去这个类作为结果,如果存
wordRecognition
- 文字识别的一种方法,不准确,仅供参考。 主要内容:界面,提取任意字点阵,识别。 环境ubuntu + eclipse + java-An approach to word recognition (Chinese). Content: UI, getting the dot metrix, recognition. Environment: ubuntu+ eclipse+ java
dsoframer.ocxP2.3.0.0
- dsoframer介绍,使用此控件可以在线展示、编辑word文档,支持从数据库中提取数据然后填充到word中或者生成word报表-dsoframer introduction, use this control can display, edit word documents, and support extraction of data from the database then fill in the word or generate word report
jjkefu_php
- 账号默认:admin 密码:admin 调用方法: 程序后台即将完善,目前尚未完全完成,客服系统会陆续更新完善! 程序简单,修改方便,功能强大,免费开源。 竖版的客服界面,仿腾讯咨询界面 QQ登录,QQ登录后可以保存聊天记录,下次登录自动提取上次聊天记录! 关键字自动回复!注意:管理员账号为机器人账号,设置关键字后 如果没有任何客服在线即转入机器人自动回复! 获得来路信息以及关键字 - 目前只设置了百度来路关键字! 客服可自定义聊天信息框中广告图片 客服可以发
chinese
- 中文分词提取关键字源代码,里面有说明文档,可以按步骤使用-Chinese word segmentation to extract keywords source code, which has documented step-by-step
WordFrequencyAnalysis
- 英语句子关键字提取算法,通过词形,词序,词长进行关键字提取-English sentences keyword extraction algorithm, through word form, word order, word length for keyword extraction
chinese
- java开发的中文分词提取关键字系统源代码,里面有说明文档,可以按步骤使用 -java development of the Chinese word keyword extraction system source code, which has documentation, you can use the step by step
CountNum
- 数据挖掘分词后的,提取样本属性,给svm-After word of data mining, extraction of the sample properties to svm
Nlpir
- 前NLPIR汉语分词系统(又名ICTCLAS2013),主要功能包括中文分词;词性标注;命名实体识别;用户词典功能;支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取;张华平博士先后倾力打造十余年,内核升级10次。国内国际排名均为第一。 项目已经配置好环境,导入Eclipse即可使用,文件内src下的TestUTF8.java可以直接运行,提供了分词接口-Before NLPIR Chinese word segmentation system (aka I
jieba-analysis-master
- 结巴分词,在Lucene中用来分词的,该分词器具有自动提取关键字的功能-Stuttered word, the word is used to Lucene, the word has the function of automatic extraction of keywords
IDF
- IDF反映了在文档集合中一个单词对一个文档的重要性,经常在文本数据挖据与信息提取中用来作为权重因子。在一份给定的文件里,词频(termfrequency-TF)指的是某一个给定的词语在该文件中出现的频率。逆向文件频率(inversedocument frequency,IDF)是一个词语普遍重要性的度量。-IDF reflects the importance of a word in a document collection for a document, often in the text
TestNLPIR
- JAVA实现的分词工具,可以进行对文本的分词并提取关键字-JAVA implemented segmentation tools, can be on the word of the text and extracting keywords
zb8
- 1、无限级多页采集,可以实现无限深度的采集 2、任务队列运行管理,支持Cron表达式 3、无限级分组任务管理,任务回收站功能 4、RSS地址采集功能 5、列表页分页采集获取功能 6、列表页附加参数获取功能 7、列表页及标签XPath可视化提取功能 8、标签纯正则替换功能 9、Http接口查看运行情况 10、导出记录为单个或多个Txt、html 文件 11、标签间自由组合功能 12、针对标签内容继续发送Http请求功能 13、无限级列表网址采集
JNA
- 中文的分词,包括词性标注、关键词提取,Java文件(word segmentation and part of speech tagging)