搜索资源 - 中文文本处理 - 搜珍网

CDN加速镜像 | 设为首页 | 加入收藏夹

热门搜索： 源码 Android 整站插件识别 p2p OpenCV 网络编程游戏源码算法更多...

登陆 | 会员注册

当前位置：

搜索资源 - 中文文本处理

下载资源主分类

源码下载

Web源码

开发工具

文档下载

其它资源

资源分类

搜索资源列表

分词051024

0下载：
中文信息处理，例如将可含有汉字和拼音的将TXT文本中的汉字和拼音用空格隔开-Chinese information processing, for example, may contain characters and the alphabet will TXT version of the characters and the alphabet with a space separated
所属分类：Windows编程
- 发布日期：2008-10-13
- 文件大小：314.42kb
- 提供者：闵学文

wordseg

0下载：
中文文本分类中对文本进行分词处理，以降温本表示称词的集合，然后用词向量来进行分类。-Chinese text classification of text-word processing, said to cool the pool said the words, then word vector to classify.
所属分类：人工智能/神经网络/遗传算法
- 发布日期：2008-10-13
- 文件大小：10.03kb
- 提供者：陈海山

中文分词函数库CipSegSDKV1.03

1下载：
东大做中文分词的源代码,主要是用于搜索引擎的中文文本预处理-Tung Chinese-made version of the source code is mainly for the Chinese search engine Hypertext
所属分类：搜索引擎
- 发布日期：2008-10-13
- 文件大小：645.65kb
- 提供者：刘斌

zidongfenci3.0

0下载：
这个是我们的中文信息处理的作业，我是用mfc结合sqlserver写的，可以自己一步一步的进行分词，并且可以对文本进行分词，还可以自己的找到其中的歧义字段，并自动保存到文件
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：67.75kb
- 提供者：yaokai

taggingPOS

0下载：
中文信息处理的源程序，用于设置词汇在文本中的位置信息，vc++编程，.cpp文件
所属分类：中文信息处理
- 发布日期：2008-10-13
- 文件大小：2.18kb
- 提供者：张莉

基于KNN的中文文本自动分类研究

0下载：
在介绍SVM和KNN分类算法的基础上,提出了一种新的、较简单的,但更为合理的基于表模型的文档表示方法,阐述了一种基于表模型的分类算法———TableKNN算法。通过实验比较TableKNN算法与传统KNN算法应用于文本分类的效果,证实了TableKNN算法在处理文本分类问题上的优越性。
所属分类：编程文档
- 发布日期：2009-04-15
- 文件大小：27.24kb
- 提供者：jxwrs@sohu.com

中文网页自动分类器

1下载：
利用knn算法实现了一个中文网页自动分类器，包括网页预处理，ictclas中文分词，基于tf-idf的文本特征表示，基于df的特征选取和基于knn的分类算法，最后通过struts2框架web发布
所属分类：源码下载
- 发布日期：2011-04-25
- 文件大小：173.12kb
- 提供者：doris_227@163.com

LJClusterDemo

0下载：
文本聚类是基于相似性算法的自动聚类技术，自动对大量无类别的文档进行归类，把内容相近的文档归为一类，并自动为该类生成特征主题词。适用于自动生成热点舆论专题、重大新闻事件追踪、情报的可视化分析等诸多应用。灵玖Lingjoin（www.lingjoin.com）基于核心特征发现技术，突破了传统聚类方法空间消耗大，处理时间长的瓶颈；不仅聚类速度快，而且准确率高，内存消耗小，特别适合于超大规模的语料聚类和短文本的语料聚类。灵玖文档聚类组件的主要特色在于： 1、速度快：可以处理海量规模
所属分类：software engineering
- 发布日期：2017-04-10
- 文件大小：1.05mb
- 提供者：lingjoin

chinese

1下载：
中文信息处理基础第一讲VC环境编程简介第二讲文件处理第三讲字符编码第四讲字频统计第五讲文本断句第六讲语料库-Basic information first deal with English-speaking environment for programming VC brief introduction stresses the second file handle character encoding the third stresses t
所属分类：SCSI/ASPI
- 发布日期：2013-06-06
- 文件大小：36.68mb
- 提供者：李明

lingpipe-3.6.0

3下载：
一个自然语言处理的Java开源工具包。LingPipe目前已有很丰富的功能，包括主题分类（Top Classification）、命名实体识别（Named Entity Recognition）、词性标注（Part-of Speech Tagging）、句题检测（Sentence Detection）、查询拼写检查（Query Spell Checking）、兴趣短语检测（Interseting Phrase Detection）、聚类（Clustering）、字符语言建模（Character
所属分类：Java Develop
- 发布日期：2014-12-05
- 文件大小：4.45mb
- 提供者：张国栋

FileProgress1

0下载：
文本结构化技术的初步实现及其中文信息处理的算法，主要以论述为主！-text structure technology to achieve the initial and the Chinese information processing algorithm, based mainly discussed!
所属分类：MultiLanguage
- 发布日期：2017-11-30
- 文件大小：189.69kb
- 提供者：

FileProgress2

0下载：
文本结构化技术的初步实现及其中文信息处理的算法，主要以论述为主！-text structure technology to achieve the initial and the Chinese information processing algorithm, based mainly discussed!
所属分类：MultiLanguage
- 发布日期：2017-11-16
- 文件大小：129.32kb
- 提供者：

KaiYuanIctclas

0下载：
ICTCLAC开源代码，可用在中文文本信息处理上，为信息抽取进行中文分词、词性标注处理，准确度达到85 以上，-failed to translate
所属分类：MultiLanguage
- 发布日期：2017-05-11
- 文件大小：2.5mb
- 提供者：chengbo

softwarecode

0下载：
中文分词是中文信息处理中的重要环节，中文分词技术广泛应用于自动翻译、文本检索、语音识别、文本校对、人工智能以及搜索引擎技术等领域。中文分词算法的选择，中文词库的构建方式，词库中词条的完备性在很大程度上与中文分词系统性能紧密相关。-Chinese word segmentation in Chinese information processing is an important part of Chinese word segmentation technology is widely used
所属分类：AI-NN-PR
- 发布日期：2017-03-27
- 文件大小：889.96kb
- 提供者：李东升

2

0下载：
高维数据特征降维研究综述-中文文本处理-Characteristics of high-dimensional data dimensionality reduction Survey
所属分类：Document
- 发布日期：2017-04-04
- 文件大小：140.16kb
- 提供者：fyc

Chinese-text-categorization-Study

1下载：
本文通过对Bayes、KNN、SVM 应用于中文文本分类进行比较实验研究。应用ICTCLAS 对中文文档进行分词，在大维数，多数据情况下应用TFIDF 进行特征选择，并同时利用它实现了对特征项进行加权处理，使文本库中的每个文本具有统一的、可处理的结构模型。然后通过三类分类算法实现了对权值数据进行训练和分类。-Based on the Bayes, KNN, SVM applied to compare the Chinese text ca
所属分类：Mathimatics-Numerical algorithms
- 发布日期：2017-03-29
- 文件大小：432.02kb
- 提供者：wulili

Chinese

0下载：
是做文本预处理时候利用爬虫收集的500个中文文档，包括分词部分、去掉特殊符号部分以及最后的相似度计算等(It is the 500 Chinese document collected by a crawler for text preprocessing, including the part of the participle, the removal of the special part of the symbol, and the final similarity calculatio
所属分类：其他
- 发布日期：2018-04-19
- 文件大小：11.74mb
- 提供者：hello_spring

ChineseChuLi

5下载：
中文文本处理的python程序，包括分词、删除特殊字符、删除停用词、爬虫程序、PCA降维、Kmean聚类、可视化等(Python programs for Chinese text processing, including participle, deleting special characters, deleting disuse words, crawler programs, PCA dimensionality reduction, Kmean clustering, visuali
所属分类：Windows编程
- 发布日期：2018-04-19
- 文件大小：12kb
- 提供者：hello_spring

新建文件夹

1下载：
文本处理，自然语言处理，包含中文和英文停用词(text processing,including chinese and english stopwords)
所属分类：多国语言处理
- 发布日期：2021-04-17
- 文件大小：3kb
- 提供者：hugo123

Python中文文本预处理

0下载：
包括删除标点、分词、删除停用词、计算相似度、文本聚类等功能
所属分类：Python
- 发布日期：2022-06-16
- 文件大小：5.06kb
- 提供者：QQLogin_6A216132E9CF891A

« 12 3 »

搜珍网 www.dssz.com

本网站为编程资源及源代码搜集、介绍的搜索网站，版权归原作者所有！　　粤ICP备11031372号

1999-2046 搜珍网 All Rights Reserved.