搜索资源列表
SogouC.reduced.20061127
- 搜狗语料 关于文本分类语料库的问题搜狗实验室搜狗实验室(Sogou Labs)是搜狗搜索核心研发团队对外交流的窗口,期望通过这个平台,展现搜狗研发团队强大的研发-Sogou corpus corpus corpus on the issue of text categorization Sogou Sogou Lab Lab (Sogou Labs) is the core of R & D team Sogou search window for foreign exchanges,
svm
- 选用支持向量机作为区分文本与非文本的分类器,支持向量机是在统计学习理论基础上发展起来的新一代学习算法,它在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。-Use support vector machine as the distinction between text and non-text classifier, support vector machine is in statistical learning theory developed on the basis of
TextCla
- 支持向量机和EM最大熵文本分类算法,压缩包中包括了测试文本词典,停用词表等-Support vector machines and EM maximum entropy text classification algorithm, compressed package includes a test text dictionary, stop word table
TextClassify-KNN-SVM
- 根据语料库对文本进行分类,有界面,KNN、贝叶斯方法-According to the corpus, text classification KNN, bayesian
naive)
- 基于文本的朴素贝叶斯分类器。是一个完整的工程。具体看readme-Text-based Naive Bayes classifier. Is a complete project. Specific look at readme
bayes
- 根据文本内容,使用朴素贝叶斯进行文档的分类。-According to the text, using Naive Bayes to classify documents.
bayes
- 利用贝叶斯朴素算法对文本的内容的褒贬属性进行分类-Naive Bayesian algorithm to appraise the contents of the text property classification
MAERJIANCE
- 场景图像中文本占据的范围一般都较小,图像中存在着大范围的非文本区域。因此,场景图像文本定位作为一个独立步骤越来越受到重视。这包括从最先的CD和杂志封面文本定位到智能交通系统中的车牌定位、视频中的字幕提取,再到限制条件少,复杂背景下的场景文本定位。与此同时文本定位算法的鲁棒性越来越高,适用的范围也越来越广泛。文本定位的方式一般可以分为三种,基于连通域的、基于学习的和两者结合的方式。基于连通域的流程一般是首先提取候选文本区域,然后采用先验信息滤除部分非文本区域,最后根据候选文本字符间的关系构造文本