搜索资源列表
classification
- 文本分来,文中进行了分词,去停用词,用TFIDF来实现-Text, the text for the word, to stop words, to achieve with TFIDF
seg
- 进行高级汉字文本分词的功能模块,可以支持多种类型文本,支持停用词过滤。产生的结果可以定制结构 。-Chinese text segmentation for advanced function modules that can support multiple types of text, support for stop words filtering. The result can be customized structure.
Gettxt
- 将网页中的文本提出,然后对文本分词,去停用词等处理,计算其词频-Make the page text, then the text word, to stop words such as processing, computing the word frequency
StopWords
- This application removes all stop words from the given text document and performs stemming operation.
Index
- 方便检索匹配等应用的,中文后序最大匹配算法的实现,数据库中词表和停用词自行更改即可-Convenient retrieval matching, Chinese applications such as after the realization of maximal matching algorithm sequences, the database tables and stop words seen to change can
FcmJava_ver2
- Create stop list hashmap using stoplist file for removing stop words
SplitDocument
- java 拆分一个文档为句子或段落,去掉了停用词,基于lucene-java split a document to a sentence or paragraph, remove stop words, based on lucene
Java
- 能实现分词,去除停用词,统计词频的Java的源代码-To achieve segmentation, removal of stop words, word frequency statistics Java source code
162100_4.1
- 【程序简介】 1、162100网址导航3号——新生发布。 2、程序短小精悍,IP库、拼音库、网址库、图片库除外,代码不到200KB。 3、PHP+Mysql构架。轻松支持一键生成全站静态。 4、程序构思、构成;安装、管理无比简洁。 5、全新的个性化管理中心,全面支持个性自助管理。 6
emlog_5.1.1
- 【程序简介】1、162100网址导航3号——新生发布。2、程序短小精悍,IP库、拼音库、网址库、图片库除外,代码不到200KB。3、PHP+Mysql构架。轻松支持一键生成全站静态。4、程序构思、构成;安装、管理无比 简洁。5、全新的个性化管理中心,全面支持个性自助管理。6、记事本、我的风格、我的收入、自定义网址、浏览记录、搜索记录、我的名站及引擎应用。7、用户创收功能。8、全面支持拼音生成栏目名,轻松支持多音字及拼音重名校正-[Introduction] 1,162100 site
fenci
- 基于IKAnalyzer2012的中文分词java代码,可以去除停用词。-The Chinese word segmentation based IKAnalyzer2012 java code, you can remove stop words.
LDA_java
- Java,LDA(Latent Dirichlet Allocation)源代码,可以实现分词、去除停用词功能。-Java, LDA (Latent Dirichlet Allocation) source code, can achieve the segmentation, removing stop words function.
ExcludeStopWord
- 对一段中文文本经中文分词后,根据停用词表,去除文档中的停用词。-After a period of Chinese text by the Chinese word, according to the stop list, the removal of stop words in the document.
WordSplit.java
- java实现的字典分词,有效去除停用词,标点符号,能识别姓名-java achieve dictionary word, the effective removal of stop words, punctuation, can identify the name
SplitWords
- 基于lucene的文档分词程序,去停用词,统计词频,计算词的权重-Lucene-based document segmentation procedures, to stop words, word frequency statistics
ReadFiles
- 对中文文本进行分词,去停用词以及计算tf-idf值-The Chinese text segmentation, excluding stop words and computing tf- idf values
php168_big5
- 1、众所周知,功能强大即是168整站最吸引人的地方,到目前为止集合了十几个功能模块,各模块之间可以自由切换,并且支持无限级分类。用户注册实现一站通。 2、优秀的HTML模板技术:用户只要懂得HTML网页的编辑,不用掌握PHP语言就可以很容易地做出漂亮的网页模板。 3、独创的标签技术,使得制作网站首页变得极其简单,做好一个HTML首页模板,然后往里边插入$label[***]字样的标签就可以在后台调取任意栏目的文章或者是图片等等. 4、完善的数据库备份和恢复功能,让您
FileDemo
- 对文件进行分词的例子.输出带词性的中文分词,已经去掉了停用词.-Examples of the file segmentation output of the Chinese word with POS, has been removed stop words.