搜索资源列表
Ngram-spliter
- 基于Ngram的中文分词,准确率能达到92 ,值得参考!-Based on the Ngram the Chinese word, the accuracy rate can reach 92 , worth considering!
slm.tar
- 利用剑桥的SLM工具包实现的一个计算ngram的代码,可以完成1-3元模型的训练以及压缩。压缩算法是利用相对熵策略压缩。-Using the Cambridge SLM toolkit to achieve a calculated ngram code, you can complete the training as well as compression of the 1-3 model. The compression algorithm is the use of compressio
Ngram_matching
- an Ngram-based video frames matching technique. This code is partial of my Master Thesis
Text-NSP-1.11.tar
- Text-NSP-1.11.tar.gz 自然语言处理的开源代码 ngram-Text-NSP-1.11.tar.gz
Patterns_demo
- Bianry tree search for ngram
NGRAM
- NGRAM中文分词压缩包,应用于网络搜索中的中文分词过程中 -NGRAM Chinese Words Segmentation
src
- 从文档文件或者数据库数据中搜索关键词。运用ngram进行模糊搜索处理-search text from files or database
prefixspan-0.4-ngram
- 数据挖掘算法,用于挖掘频繁序列模式,包含完整的使用说明文档-Data mining algorithm for mining frequent sequential patterns, including the complete user documentation
datamininggram
- ngram java 算法实现,可以自己更改n的个数,自己写的比较实用-ngram java algorithm
NGram
- java 实现基于N-gram的文本分类算法-java based N-gram-based text classification algorithm
Source-Code
- 请使用OpenNLP当中的英文文档,en-sent.bin 以便进行英文断句。 请使用OpenNLP当中en-token.bin 以便进行英文单词的tokenlization. 系统的启动代码名称是Command collect center-NGram Model based on add-delt smooth tec. the datastructure of NGram model s memony structure is using prefix tree as inde
Ngram
- 数据预处理一套源码 处理文本数据 包含分词 提取词干 等-Data preprocessing is a set of source code
ngram模型分词与统计算法
- N-Gram(有时也称为N元模型)是自然语言处理中一个非常重要的概念,通常在NLP中,人们基于一定的语料库,可以利用N-Gram来预计或者评估一个句子是否合理。另外一方面,N-Gram的另外一个作用是用来评估两个字符串之间的差异程度。这是模糊匹配中常用的一种手段。本文将从此开始,进而向读者展示N-Gram在自然语言处理中的各种powerful的应用。(N-Gram (sometimes referred to as N metamodel) is a very important concept