搜索资源列表
文本信息提取技术
- 文本信息提取技术- Text information extraction technology
Stringindexof
- 有时候我们拿到一个HTML文本的时候我们并不在意它的格式,而只是想提取其中包含的文本信息。例如说为了在手机上显示一个超文本,如果直接显示的话那肯定会收到一大堆的错误,很多手机根本没有能力显示HTML信息,因此我们需要把存在于HTML中的文本提取出来并使用WML来重新组合以便手机可以正确的查看,这样做虽然丢失了格式,但是毕竟这种情况下更关心的是数据。下面给出一段程序完成这个功能,很简单!-Sometimes we get an HTML version of the time we do not
SurveyTextMining
- 这是一本关于文本挖掘的书籍,包括聚类 分类 信息提取的内容
li
- 实现信息隐藏,将要隐藏的文本信息编码并隐藏到图像中,接收方使用相同密钥能够将隐藏信息提取
基于XML的多媒体信息检索的研究
- 因特网的飞速发展与多媒体信息的广泛应用极大地改变了人们获取多媒体信息的方式和手段。各种多媒体信息检索系统已逐渐成为各类用户获取多媒体的主要工具,但是目前的两种多媒体检索方法—基于文本的多媒体信息检索和基于内容的多媒体信息检索,二者有固有的缺点,表现为:基于文本的多媒体检索,利用文本对多媒体进行描述,容易引起信息失真等缺陷。而基于内容的多媒体检索,在多媒体信息内容的描述、特征的自动提取、多媒体的同步技术、匹配和结构化的选择等方面具有问题。这些问题的出现导致多媒体检索系统的检索效果往往不能尽如人意,
格式文档文本提取
- 提取OFFICE、PDF、JPG中文本信息,请安装相应的FILTER
Foxit PDF SDK (DLL) 2.0
- Foxit PDF SDK (DLL) 2.0今天正式发布!它拥有难以置信的小巧体积和快捷的启动速度,方便您轻松开发自己的PDF应用程序。新版本不仅保留了旧版本的所有的功能(基础模块),而且还新增了两大模块——可提取文本信息的文本模块和可创建、修改PDF文件的编辑模块。, To run the demo program, please copy the "fpdfsdk.dll" included in the Foxit PDF DLL SDK package into t
Watermark_2
- 信息隐藏与水印技术系列实验之二:空域不可见LSB图像水印算法(开发工具:vc2005): 实现在一个256色灰度载体图像的LSB中嵌入一个二值(用256色模拟)灰度文本图像水印。其主要功能如下: (1)可以载入不同的载体图像和水印图像,但载体图像和水印图像在本软件中被限制为256色灰度图像,若要用其它图像甚至彩色图像,请修改源码。 (2)可以对含水印图像中的水印信息进行提取,提取时不需要原始图像。 (3)LSB攻击可使含水印图像中的水印信息丢失。 (4)可以计算峰值信噪比(P
自组织神经网络在文本分类中的应用研究
- 针对信息挖掘中的文本自动分类问题 提出了一种基于自组织特征映射网络的分类方法 网络由输入层和 竞争层组成 输入层节点与竞争层节点实行全互连接 输入层完成分类样本的输入 竞争层提取输入样本所隐含的 模式特征 并对其进行自组织 在竞争层将分类结果表现出来 分无监督和有监督两个阶段完成对网络的分类训练 该方法在特征提取时充分考虑了特征项在文档中的位置信息 构造出模糊特征向量 使自动分类原则更接近手工分 类方法 以中国期刊网全文数据库部分文档数据为例验证了该方法的有效性
text-data-mining
- 此程序实现了如何在TXT或WORD文档中进行数据挖掘,在文本中提取有用信息-The realization of this procedure how to TXT or WORD document to carry out data mining, in the text to extract useful information
extract_document
- 这是一个提取 Reuter-21578 的程序, 用做自然语言处理, 文本分类聚类,和信息检索的测试集!-This is an extract of the Reuter-21578 procedure, used for natural language processing, text classification clustering, and information retrieval test collection!
Watermark_3
- 信息隐藏与水印技术系列实验之三:DWT变换域可见图像水印算法(开发工具:vc2005):实现在一个256色灰度载体图像变换域数据中嵌入一个256色灰度文本图像水印。其主要功能如下: (1)可以载入不同的载体图像和水印图像,但载体图像和水印图像在本软件中被限制为256色灰度图像,若要用其它图像甚至彩色图像,请修改源码。 (2)水印在载体图像中的嵌入位置及嵌入强度可以设置。 (3)可以计算原始图像和含水印图像的峰值信噪比(PSNR),以对含水印图像进行客观质量评价。 (4)源码结构清
Watermark_4
- 信息隐藏与水印技术系列实验之四:DWT变换域不可见图像水印算法(开发工具:vc2005): 实现在一个256色灰度载体图像的DWT变换域低频LL系数中多次重复嵌入一个256色灰度文本图像水印。其主要功能如下: (1)可以载入不同的载体图像和水印图像,但载体图像和水印图像在本软件中被限制为256色灰度图像,若要用其它图像甚至彩色图像,请修改源码。 (2)可以对含水印图像中的水印信息进行提取,提取时需要原始图像。 (3)剪切攻击可使含水印图像中的水印信息部分丢失。 (4)可以计算
Abstract
- 根据文本各功能类的编写,在.net平台下实现文摘的提取,既可以返回给用户一个简洁重要相对全面的信息。-According to the text of the preparation of various functional categories, in the. Net platform to achieve digest extraction, both can return to the user a concise and comprehensive information is re
Text_Feature_Extraction
- 文本特征提取方法研究。文本的表示及其特征项的选取是文本挖掘、信息检索的一个基本问题,它把从文本中抽取出的特征词进行量化来表示文本信息。-Text Feature Extraction. And characteristics of the text of that item selection is text mining, information retrieval is a basic problem, which to extract from the text to quantify t
jahmm
- 基于隐马尔科夫模型的文本信息提取,压缩包中带有源码和相关资料-Hidden Markov Model based text information extraction, compressed packets with source code and related information
关键字提取
- 原理是从大量的文本中提取关键信息, 算法是 基于搜索引擎那一套,还包括词频计算!
石鑫华视觉网shixinhua.com-文本信息提取技术概述
- 提取文字信息,将纸面文字转换成电子版,方便存取(Extract text information, convert paper text into electronic version, convenient access)
CNN_sentence_tensorflow-master
- 基于卷机神经网络的文本信息提取应用的设计与实现,cn(Design and Implementation of Text Information Extraction Application Based on Reel Neural Network)