搜索资源列表
Test
- 用java实现中文文本的提取,去除英文字符-Using java to achieve Chinese text extraction, removal of English characters
Ngram
- 数据预处理一套源码 处理文本数据 包含分词 提取词干 等-Data preprocessing is a set of source code
TFIDF
- 很好用的程序,进行中文特征的提取!相信能帮到大家对文本特征的提取,数据的挖掘-It s very useful!
IDF
- IDF反映了在文档集合中一个单词对一个文档的重要性,经常在文本数据挖据与信息提取中用来作为权重因子。在一份给定的文件里,词频(termfrequency-TF)指的是某一个给定的词语在该文件中出现的频率。逆向文件频率(inversedocument frequency,IDF)是一个词语普遍重要性的度量。-IDF reflects the importance of a word in a document collection for a document, often in the text
TestNLPIR
- JAVA实现的分词工具,可以进行对文本的分词并提取关键字-JAVA implemented segmentation tools, can be on the word of the text and extracting keywords
LDA
- 主要用于在文本分类中,对文本进行特征提取,是一种主题向量模型-Mainly used in text classification, text feature extraction, is a theme vector model
deepsoon_v2.0
- 功能介绍: 地平线门户网是采用APS.NET + MySQL技术开发的一个开源项目,利用该项目可以轻易的订制自己的个人站点。系统后台操作简单,树形目录文档管理,适合具有初级网页开发技术的人员建站。利用系统自带的前端示例,可以搭建清新、个性化的平台。 系统后台采用树形目录管理方式,可以自定义整站栏目以及任意基本的子栏目,实现傻瓜式的栏目Diy,让您的站点栏目规划轻松搞定! 系统后台文本编辑器为自主研发,所见即所得,支持插入图片,视频,文字修饰,附件上传等。 系统前端设计大气典雅,适
vertigohomegbook
- 基于文本存储数据, 系统登录采用了Cookie管理 网页的显示采用模板化管理 多用户留言管理系统 真实 IP 提取,使用代理也逃不出手心 :) 但这个功能对一些代理服务器没用 :( 悄悄话功能(只有版主才可以看到)。 oicq 在线是否显示 可以设定注册是否开启 增加全文搜索功能,可以使用关键字对数据库全文进行搜索-Based on text storage data, System login using the Cookie management We
javaEnglish-text-extraction-stems
- 英文文本抽取词干,实现波特词干提取算法 Java代码-English text extraction stems Java code
Kmeans
- 算法思想:提取文档的TF/IDF权重,然后用余弦定理计算两个多维向量的距离来计算两篇文档的相似度,用标准的k-means算法就可以实现文本聚类。源码为java实现(Algorithm idea: extract the TF/IDF weight of the document, then calculate the distance between two multidimensional vectors by cosine theorem, calculate the similarity
php下mysql注册并加密
- 使用post提取文本框内数据,以insert将数据插入到数据库内并用sha1加密密码。