搜索资源列表
ASM3
- cootes提出的ASM算法的matlab实现。在cootes用于课堂使用的源代码的基础上改写。改正了原来代码中的一些错误,加入了方便使用的样本训练标注保存环节。供图像分析处理,模式识别,人工智能研究者使用。-the ASM Algorithm Implementation of Matlab. Cootes used in the classroom use of the source code on the basis rewritten. To correct the original s
POSTagger
- (1)从已经标注好词性的语料中统计得到词性标记的二元转移矩阵,以及每个词以确定的词性标记出现的次数等数据(训练阶段) (2)利用动态规划算法快速选取词性标记路径,得到词性标记结果 (3)可以选择不同的词性标记集 -(1) from the good part-of-speech tagging has been the Corpus statistics to be part of speech marking the transfer of binary matrix, a
Kappa
- 用于计算人工标注语料时,不同标注者之间的共同认知程度的Kappa值计算算法-used in the calculation of artificial tagging corpus, between different tagging common understanding of the extent of the Kappa values Algorithm
CRFPP0[1].53
- 条件随机域,主要用于标记序列,可以进行分词,词性标注,句法分析,以及文本抽取等。-condition random field
TextClustering
- 文本聚类,VC编程实现,作为一种无监督的机器学习方法,聚类由于不需要训练过程,以及不需要预先对文档手工标注类别,因此具有一定的灵活性和较高的自动化处理能力-Text Clustering, VC programming, as an unsupervised machine learning method, clustering by eliminating the need for the training process, and do not need to manually pre-ma
AutomatedNegotiatioDecisionModelasedonMachineLearn
- 模型利用协商历史中隐含的信息自动对数据进行标注以形成训练样本,用最小二乘支持向量回 归机学习此样本得到对手效用函数的估计,然后结合自己和对手的效用函数构成一个约束优化问题,用遗传算法求 解此优化问题,得到的最优解就是己方的反建议.实验结果表明,在信息保密和没有先验知识的条件下,此模型仍然 表现出较高的效率和效用-The proposed model labels the negotiation history data automatically by making full use
ChinesePronominalCoreferenceResolution
- 基于决策树的汉语代词共指消解 提出一种统计与规则相结合的决策树算法进行汉语代词共指消解 ,利用规则过滤掉属性冲突的反例 ,一定程 度上弥补了决策树算法忽略属性关联性的缺点. 采用 Chinese Treebank 作为语料进行测试 ,手工标注其中的共指 关系和特征向量 首先用规则过滤 ,然后采用 C415 决策树算法选择先行语. 实验结果显示 ,消解成功率为 82159 ,其中人称代词和指示代词的成功率分别为 87160 和 75121 .-A total based on de
cixingbiaozhu
- 词性标注,输入一句中文的句子,可以自动的划分成一个个单词,并为该单词标注上词性-Speech tagging, input a Chinese sentence, can automatically divided into a words, and the word mark on the part of speech
HMM
- 隐马尔科夫模型(Hidden Markov Model, HMM)是对马尔科夫模型的一种扩充。 隐马尔科夫模型的基本理论形成于上世纪60年代末期和70年代初期。隐马尔科夫模型在计算语言学中有着广泛的应用。例如隐马尔科夫模型在词类自动标注中的应用。 该课件较详细的介绍了HMM,并有生动的实例及比喻帮组理解-Hidden Markov Model
Lable.m
- 找出图像中的连同区域 标注序号 二值图像的连同区域判断-Find the image number, together with the regional dimension with the binary image to determine areas
ICTCLAS50_Windows_32_JNI
- 中科院开发的中文分词算法,带词性标注等,经典的一个算法-Chinese Academy of Sciences of the Chinese word segmentation algorithm developed, with part of speech tagging, etc., a classic algorithm
vbPmapinfo
- 实现地图的距离查询,地点查询,实施标注和最短路径获取等-Map distance queries, location queries, and implementation of standards and the shortest path access
Multi-class-SVM-Image-Classification
- 基于神经网络的遥感图像分类取得了较好的效果,但存在固有的过学习、易陷入局部极小等缺点.支持向量机机器学习方法,根据结构风险最小化(SRM)原理,表现出很多优于其他传统方法的性能,本研究的基于多类支持向量机分类器的遥感图像分类取得了达95.4 的分类精度.但由于遥感图像分类类别多,所需训练样本较大,人工选择效率较低,为此提出以人工选择初始聚类质心、C均值模糊聚类算法自动标注训练样本的基于多类支持向量机的半监督式遥感图像分类方法,期望能在获得适用的分类精度的基础上有效提高分类效率-Neural ne
ChineseSegment
- 一个完整的中文分词程序,有源码,词典,训练集。算法简洁高效,准确率高。包含了一种将标注语料和词典融合的新型分词方法。将语料分割为2:1为训练集和测试集,加上一个外部词典,准确率可以达到95 。适合入门者学习。也适合需要一个简单分词工具的应用。-A Chinese word segmentation procedures, source, dictionary, the training set. The algorithm is simple and efficient, high accura
label_allign_face
- 人脸眼睛标注,并获取对齐之后的人脸(matlab code)。-Matlab code for labeling eye coordinates, and align faces into standard form in terms of size and pose of faces.
nlu_project
- 采用机器学习的方法进行自然语言处理,对中文进行分词和词性标注。分词采用crf模型,词性标注用hmm模型,解码算法为Vertibi算法。本系统使用java语言编写-Using machine learning methods for natural language processing, carried out on the Chinese word segmentation and POS tagging. Segmentation using crf model, tagging with
rough-set
- 基于粗糙集的图像语义自动标注分类算法代码-Image semantic auto-tagging based on rough set classification algorithm code
HmmPos
- 本文主要研究在给定的机械词频词典下的基于字符串匹配的中文分词系统,将一整段文字基本正确的切分成词,并标注上词性。在实现分词的过程中,最重要的两个因素就是分词速度和分词精度。因此,我们以分词速度、分词正确率和分词召回率作为中文分词评测标准,力求达到较高的分词速度和分词精度-word Tagging
natural-language-processing
- 统计自然语言处理PPT-刘挺 中科院自动化研究所、模式识别国家重点实验室的 介绍的内容有统计机器翻译、词法分析与词性标注、语料库与词汇知识库-Statistical Natural Language Processing PPT-Ting Liu Institute of Automation, Chinese Academy of Sciences, State Key Laboratory of Pattern Recognition content presentation of
kMeans
- 机器学习算法,无监督学习,利用k均值聚类算法对未标注数据分组-Machine learning algorithms, unsupervised learning, the use of k-means clustering algorithm for unlabeled data packets