搜索资源列表
1
- 基于WEKA平台的文本聚类研究与实现 文本聚类是文本挖掘领域的一个重要研究分支,是聚类方法在文本处理领域的应用。本文对基于空间向量模型的文本聚类过程做了较深入的讨论和总结,利用文本语料库,基于数据挖掘工具研究并实现了文本聚类的过程。本文首先给出了文本聚类的思想和过程,回顾了文本聚类领域的已有成果,列举了文本聚类领域在特征表示、特征提取等方面的基础研究工作。另外,本文回顾了现有的文本聚类算法,以及常用的文本聚类效果评价指标。在研究了已有成果的基础上,本文利用20 Newsgroup文本语料库,
kmeans
- 利用k-means算法进行聚类,K-means算法以欧式距离作为相似度测度,它是求对应某一初始聚类中心向量V最有分类,使得评价指标J最小。算法采用误差平方和准则函数作为聚类准则函数。-Algorithm using k-means clustering, K-means algorithm Euclidean distance as a similarity measure, it is the pursuit of the vector V corresponding to a initial
SDindex1
- 求解聚类游戏性评价指标SD指数,自己编制的,可以运行。-a algorithm to get SD index, which is used to evaluate the clustering result.
cPP_cluster_evalue
- c++实现的D,CH,I,S,SSE聚类评价指标。自己在用,希望对大家有帮助。有不足之处请多多包涵,附有参考文献和说明。-c++ realized D, CH, I, S, SSE clustering evaluation. Themselves with the hope that everyone has to help. Inadequacies please bear with me, with references and instructions.
Clustering-Algorithm
- 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。本代码主要用于过程监控故障检测-Clustering analysis, also called group analysis, which is a statistical analysis method of the research (sample or index) classification problem, is also an important algorithm of dat
qengqang_v56
- isodata 迭代自组织的数据分析,混沌的判断指标Lyapunov指数计算,用MATLAB实现动态聚类或迭代自组织数据分析。- Isodata iterative self-organizing data analysis, Chaos indicator for Lyapunov index calculation, Using MATLAB dynamic clustering or iterative self-organizing data analysis.
xm464
- 一个很有用的程序,混沌的判断指标Lyapunov指数计算,基于欧几里得距离的聚类分析。- A very useful program, Chaos indicator for Lyapunov index calculation, Clustering analysis based on Euclidean distance.
关于回归神经网络的交通状态判别
- 聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。 聚类(Cluster)分析是由若干模式(Pattern)组成的,通常,模式是一个度量(Measurement)的向量,或者是多维空间中的一个点。 聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。(Clustering algorithm)
matlab_bgl-4.0.1
- 统计复杂网络度分布介数异质性平均聚类系数和平均距离等指标(Structural properties of the different real networks. Structural properties include net- work size (N), link number (E), degree heterogeneity (H =< k2 > = < k >2), degree assortativity(r), average clustering
Clustering
- 1) 使用凝聚型层次聚类算法(即最小生成树算法)对所有数据点进行聚类,最后聚成3类。相异度定义方法可选择single linkage、complete linkage、average linkage或者average group linkage中任意一种。 2) 使用C-Means算法对所有数据点进行聚类。C=3。 任务2(必做): 使用高斯混合模型(GMM)聚类算法对所有数据点进行聚类。C=3。并请给出得到的混合模型参数(包括比例??、均值??和协方差Σ)。 任务3(全做): 1) 参考数据文