资源列表
nlp7294
- 22w条打好标签的数据,供短文本主题分类使用(22W labeled data for short text topic classification)
Python数据分析与挖掘实战
- 本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。(There are 15 chapters in this book, which are divided into two parts: the basic c
数据挖掘导论 完整版
- 讲解数据挖掘中用到的基本算法,描述了算法的数学原理,以及实际应用(Explain the basic algorithm used in data mining, describe the mathematical principle of the algorithm, and practical application)
PCA+mnist
- 基于python,利用主成分分析(PCA)和K近邻算法(KNN)在MNIST手写数据集上进行了分类。 经过PCA降维,最终的KNN在100维的特征空间实现了超过97%的分类精度。(Based on python, it uses principal component analysis (PCA) and K nearest neighbor algorithm (KNN) to classify on the MNIST handwritten data set. After PCA dime
python疫情数据可视化
- 通过时事数据可视化系统,可以清楚地了解全球疫情分布的状况以及密度,以便做出相应的对策(Through the current affairs data visualization system, it is possible to clearly understand the distribution and density of the global epidemic in order to make corresponding countermeasures)
SpringBoot+jsoup爬虫
- 本地创建.xlsx文件,里面存放京东商品地址,运行项目启动导入本地xlsx文件,自动爬取文件中地址信息下载到本地
GA-PLS-toolbox
- GA-PLS遗传偏最小二乘法 用于数据挖掘或者是光谱特征变量筛选-GA-PLS Genetic Partial Least Squares
airPLS-2.0-matlab
- airpls自适应迭代重加权惩罚最小二乘算法背景扣除的matlab代码- airpls background subtraction matlab code
k-means
- K均值算法,将数据矩阵命名为data,设置聚类簇个数k,可对多维数据进行聚类。-K mean algorithm, the data matrix is named data, set the number of clusters K, can be used to cluster the multi-dimensional data.
sparse-subspace-clustering
- 关于稀疏子空间聚类的算法程序实现,及对应的论文,matlab源码实现。-On sparse subspace clustering algorithm procedures, and the corresponding paper, matlab source code.
kernel-kmeans
- 实现kernel k-means 聚类,可以处理非线性数据-Implement kernel k-means clustering, can handle nonlinear data
中医证型的关联规则挖掘
- Apriori关联规则在中医证型中的应用,有对应数据及说明文档,可以运行(It is mainly the application of Apriori association rules in TCM syndromes, which can be run with corresponding data and process descr iption)