搜索资源列表
3
- 数据挖掘算法VC文本提取-data mining algorithms VC Text Extraction
RTFLib.zip
- 一个封装好的类(RichText Builder (StringBuilder for RTF).可以将Rich Text控件中的内容直接保存为RTF格式文件.,A good type of package (RichText Builder (StringBuilder for RTF). Could be in the Rich Text content controls directly saved as RTF files.
text-data-mining
- 此程序实现了如何在TXT或WORD文档中进行数据挖掘,在文本中提取有用信息-The realization of this procedure how to TXT or WORD document to carry out data mining, in the text to extract useful information
Discover
- 一个相对很完善的数据挖掘系统(少部分功能欠缺),不仅包括了按类Association(内含Apriori,C4.5,GrowTree),Classification(ID3),Cluster划分常用的算法及个人优化后的算法。同时包含了多种数据源(MS Access,Excel,SQL Server,TEXT)的界面直接连接方式。界面方面更像一个专业的系统,采用了类VC浮动多框架界面,也可以作为界面编程的参考。这个工程的分数和其他小工具的分数一样,感觉亏大了:)-A relatively well
libsvm-2.9
- 文本分类工具libsvm-2.9.zip 信息检索和数据挖掘的中用到的工具包, 里面有C++、JAVA、Python等多个语言版本-Libsvm-2.9.zip text classification tool for information retrieval and data mining tools used in the package, inside C++, JAVA, Python and other languages
57578895BAYES
- 用基于贝叶斯的的方法对文本进行分类主要用于数据挖掘领域-Using the method based on Bayesian text classification is mainly used for data mining
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
The-programming-collective-wisdom
- 《集体智慧编程》(programming collective intelligence building smart web 2.0 applications)以机器学习与计算统计为主题背景,专门讲述如何挖掘和分析web上的数据和资源,如何分析用户体验、市场营销、个人品味等诸多信息,并得出有用的结论,通过复杂的算法来从web网站获取、收集并分析用户的数据和反馈信息,以便创造新的用户价值和商业价值。全书内容翔实,包括协作过滤技术(实现关联产品推荐功能)、集群数据分析(在大规模数据集中发掘相似的数
SogouC.reduced.20061102.tar
- 搜狗语料库,用于文本分类 数据挖掘 机器学习里面非常有用-Sogou corpus for text classification data mining machine learning which is very useful
CMSimple_a5
- 简易内容管理系统 CMSimple是一种自由的内容管理系统。标榜架构简单,程式档案小并且反应快速。系统以PHP编写,可以在各种平台上运作。 CMSimple不需要使用数据库,所有的页面资料都以一个超文件档案格式,名称为content.htm,存于万维网服务器上。纯文字档的资料设计使得安装与备份工作相对较为简单。 CMSimple的后台管理,仅允许单一用户使用。透过后台管理,可设定各种与页面展示相关的参数。与许多内容管理系统相同,CMSimple提供延伸程式开发架构的设计,
p_fangbaidu_kuaso
- 仿百度搜索引擎软件蜘蛛组件包括三大功能模块:链接采集、网页分析、无效网页扫描; 自动识别GB2312、BIG5、UTF-8、Unicode等网页编码; 文件类型证察防止非文本类型文件采集; 蜘蛛可以采集ASP、PHP、JSP等动态数据网页和HTML、SHTML、XHTML等静态网页; 支持续采功能,如果因系统、网络等故障问题终止采集,系统将在下次启动采集时提示您是否“继续采集”或“结束任务”; 采集任务管理功能可以设置多个采集任务安排计划工作,每一个采集任务将会
coreseek-3.2.14-win32
- Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景,版本是3.2.14-Coreseek is a Chinese text retri /search software to open source GPLv2 license release, Sphinx-based independent research
wine
- wine数据集,用于聚类分析,关联分析,文本挖掘-wine data set for cluster analysis, correlation analysis, text mining
OperationTXT-2
- 用c#语言读入文本文档商品清单,计算总价格 将规则的几列数据放入文本文档,用c#语言读取数据计算并将结果写入数据,这种方法在计算采矿工程覆岩三带、surfer插分起伏地表建模等处有很大用处-With c# language reads text documents list of goods to calculate the total price will be several columns of data rules into your text document, reads the