搜索资源列表
maxent-20041229[1].win32
- 文本分析中基于统计的方法中,最为常用的最大熵算法,该源码为Python版,广泛应用于词性标注,词义消岐等领域-text analysis based on statistical methods, the most commonly used of maximum entropy algorithm, the source code for Python version, widely used in tagging, Meaning Consumers divergent fields
word-findANDcount
- 这是一个原创的文章信息自动标引和分类小程序。可以用于文本分析。功能还在不断完善中:)-This is an original article automatic indexing and classification of small programs. Text analysis can be used. Capabilities are also constantly perfected :)
AutoSummary-0.1.0a-src.tar
- AutoSummary uses Natural Language Processing to generate a contextually-relevant synopsis of plain text. It uses statistical and rule-based methods for part-of-speech tagging, word sense disambiguation, sentence deconstruction and semantic anal
lindatanetwork1.rar
- 主要是数据挖掘中的文本挖掘算法及其分析,其中包括层次聚类,空间向量模型等,处理对象有对于网页的也有针对纯文本的。,Mainly in data mining and analysis of text mining algorithms, including hierarchical clustering, vector space model to deal with subjects of the pages are for plain text.
Source_Code
- 中文分词系统分析库,可以对UTF8表述的中文文字进行分词操作, 支持外挂的词库和手动干预(回调方式)的加权处理。 可用于搜索引擎的基础分词开发-Chinese word segmentation system analysis libraries, can be expressed UTF8 Chinese text segmentation operation, support plug and manual intervention in the thesaurus (callback me
Lucene.Net.Analysis.Cn
- Lucene是什么? Lucene是Apache组织的一个用JAVA实现全文搜索引擎的开源项目。后来有人将Lucene移植到。Net语言。 Lucene是一个信息检索的函数库(Library),利用它你可以为你的应用加上索引和搜索的功能。 Lucene的使用者不需要深入了解有关全文检索的知识,仅仅学会使用库中的一个类,你就为你的应用实现全文检索的功能。 不过千万别以为Lucene是一个象google那样的搜索引擎,Lucene甚至不是一个应用程序,它仅仅
webcat
- 这是一个100 %纯Java库,您可以使用适用于N元 分析技术的过程分为文本文件。 该计划包括几个不同的分类算法, namelly 支持向量机,贝叶斯Logistic回归,神经网络分类和文本压缩 算法。如支持向量机和贝叶斯Logistic回归,一个 “一对一” 用于多类分类。更详细的说明这些学习算法和可用的选项,请提供的javadocs 。-It is a 100 pure Java library that you can use to apply N-Gr
NLU
- 内容很多,包括文本分类、机器翻译、自然语言理解、搜索引擎、词法分析等资料-A lot of content, including text classification, machine translation, natural language understanding, search engine, lexical analysis, etc.