搜索资源列表
TextProcessing
- 可爱的 Python:Python中的文本处理 David Mertz 博士 总裁, Gnosis Software, Inc.-lovely Python : The Python text processing CEO Dr. David Mertz, Gnosis Software, Inc..
网上信息抽取技术纵览
- 介绍信息抽取领域的发展。第2.1.节比较了信息抽取和信息检索的区别;第2.2.节介绍IE的历史。接下来两节解释评价IE系统的指标和常用的两派技术方法。信息抽取技术所处理的文本类型将在第2.5.节中说明。第2.6.节描述信息抽取技术可利用的网页特征。
基于KNN的中文文本自动分类研究
- 在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方 法,阐述了一种基于表模型的分类算法———TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文 本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。
javaNIO
- 一系列缓冲区类支撑起了 Java 2 平台标准版的新 I/O(NIO)包。这些类的数据容器形成了其它 NIO 操作(如套接字通道上的非阻塞读取)的基础。在本月的 Merlin 的魔力中,常驻 Java 编程专家 John Zukowski 展示了如何操作那些数据缓冲区来执行如读/写原语这样的任务以及如何使用内存映射文件。在以后的文章里,他将把这里所提到的概念扩展到套接字通道的使用。 Java 2 平台标准版(Java 2 Platform Standard Edition,J2SE)1.4 对
symbian
- XML parsing in S60 3rd 一、XML文件解析的机制和框架 Symbian已经为我们提供了类CParser在Symbian平台上对XML文件进行解析,Symbian中的CParser是基于SAX(SAX,Simple API for XML)方式的,它是基于事件流方式,与DOM相比SAX方式在操作上会有点麻烦而且显得没那么好理解。简要比较一下,DOM是将XML在内存中展开成一个树的模型,我们可以方便地访问它的每个子节点,可读可写。但是SAX呢?我们只能通过一个单向文本流去解
正则表达式之道
- 一个正则表达式,就是用某种模式去匹配一类字符串的一个公式。很多人因为它们看上去比较古怪而且复杂所以不敢去使用——很不幸,这篇文章也不能够改变这一点,不过,经过一点点练习之后我就开始觉得这些复杂的表达式其实写起来还是相当简单的,而且,一旦你弄懂它们,你就能把数小时辛苦而且易错的文本处理工作压缩在几分钟(甚至几秒钟)内完成。
LJClusterDemo
- 文本聚类是基于相似性算法的自动聚类技术,自动对大量无类别的文档进行归类,把内容相近的文档归为一类,并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。 灵玖Lingjoin(www.lingjoin.com)基于核心特征发现技术,突破了传统聚类方法空间消耗大,处理时间长的瓶颈;不仅聚类速度快,而且准确率高,内存消耗小,特别适合于超大规模的语料聚类和短文本的语料聚类。 灵玖文档聚类组件的主要特色在于: 1、速度快:可以处理海量规模
bat批处理完整教程
- 第一章 批处理基础 第一节 常用批处理内部命令简介 批处理定义:顾名思义,批处理文件是将一系列命令按一定的顺序集合为一个可执行的文本文件,其扩展名为BAT或者CMD。这些命令统称批处理命令。 小知识:可以在键盘上按下Ctrl+C组合键来强行终止一个批处理的执行过程。 了解了大概意思后,我们正式开始学习.先看一个简单的例子!
2
- 高 维 数 据 特 征降维研究综述-中文文本处理-Characteristics of high-dimensional data dimensionality reduction Survey
chuli
- 区域增长法对图像进行分割处理,并去噪处理,图像增强-Region-growing segmentation of the image processing and de-noising processing, image enhancement
Perl-study
- 本人学习perl的过程文档,对于一个初学者如何使用perl做文本处理有一定的帮助作用,绝对原创-I am learning perl process documentation, for a beginner how to use perl to do there is some help text processing role, absolutely original
Shell_wenjiancaozuo_wenbenguanli-
- perl语言学习的笔记——内容为perl语言在文件处理和文本处理方面的笔记-perl language learning notes- perl language notes in document processing and text processing
boost-xpressive
- 正则表达式是处理文本强有力的工具,它使用一套复杂的语法规则,能够解决文本处理领域的绝大多数问题,如验证,匹配,查找,替换等,这些问题用通常的字符串算法是很难甚至无法解决的。这里包含boost xpressive的基本用吧-boost xpressive.boost xpressive.boost xpressive.regex,match,search
USE-OF-xpressive
- 正则表达式是处理文本强有力的工具,它使用一套复杂的语法规则,能够解决文本处理领域的绝大多数问题,如验证,匹配,查找,替换等,这些问题用通常的字符串算法是很难甚至无法解决的。这里包含boost xpressive的基 本用法-boost xpressive.boost xpressive.boost xpressive.regex,match,search
文件操作批处理
- 常用的文件批处理工具,包括按关键字分割文本,获取文件名,文件重命名,很实用。(Very useful bat tools for file dealing like dividing txt file, rename files....)
autoCFG_v0.0.3
- 粘贴复制文件 替换文本 批处理脚本 test test test(Paste the copy file replace text Batch scr ipt Test Test Test)
Console-维吉尼亚加密文本
- 可对任意文件进行加密解密处理,安全性极高。(It can be encrypted and decrypted to any file, with high security.)
强大的文本处理工具
- 合并,分类,删除指定列,一键分区,格式化,去除杂质,调整位置,文件分割,文件替换,筛选数字文字,去除重复
Python核心编程
- 全书总共分为3部分。第1部分为讲解了Python的一些通用应用,包括正则表达式、网络编程、Internet客户端编程、多线程编程、GUI编程、数据库编程、Microsoft Office编程、扩展Python等内容;第2部分讲解了与Web开发相关的主题,包括Web客户端和服务器、CGI和WSGI相关的Web编程、Django Web框架、云计算、高级Web服务;第3部分则为一个补充/实验章节,包括文本处理以及一些其他内容。
文本处理高级语料库
- 自然语言处理语料库代码,能够提供大量方向基础入门信息。