资源列表
settings
- 使用网格搜索获得xgboost的最佳参数(Use grid search to get the best parameters for xgboost)
PCA TEST
- 主成分分析程序,能够对高维数据降维分析,适用于高维特征降维,大数据分析(The principal component analysis program can analyze dimensionality reduction of high-dimensional data.)
python与数据科学代码
- 《python与数据科学》全部源码,为ipynb格式。(all source code of "Python and data science")
Python数据可视化编程实战_code
- Python数据可视化编程实战_配套原代码(Matching the original code)
HMM-homework
- 隐马尔科夫实现,包含forward-hmm, Viterbi-hmm, Baum-Welch-hmm(Hidden Markov implementation, including forward-hmm, Viterbi-hmm, Baum-Welch-hmm)
python
- 风控建评分卡模型程序,常用于消费金融,P2P,银行业(Code for Score card model)
mvstats
- 将ggplot2的作图结果合并为一个图,可以定义cols的值从而调整输出的结果(Combining the graphical results of ggplot2 into a graph defines the values of cols to adjust the output)
数据挖掘各类算法
- apriori、id3、c4.5、fp树等算法的的python实现(Python implementation of apriori, id3, c4.5, FP Tree and other algorithms)
TianCheng-master_chusai_qingyu
- 2018年甜橙金融杯大数据建模大赛初赛方案:通过追踪时间、设备、ip和经纬度等属性的变化来建模判断UID是否为黑产链 ## 代码说明: - gen_stat_feat.py 统计特征 - gen_w2v_feat.py word2vec特征 - lgb_train.py lgb训练模型 两份特征建模加权8:2比例融合即可0.792+,单独统计特征加UID列建模即可0.795。(The preliminary scheme of the 2018 Sweet
用Python写网络爬虫
- Python爬虫教程及项目实战,你值得拥有。(Python crawler tutorial and project practice)
R语言实现粗糙集
- 利用R语言实现粗糙集,包括数据和例子,帮助理解各个函数的用途
k-means-for-iris
- 利用K均值聚类对鸢尾花样本进行聚类的matlab程序,包含源代码、样本数据、聚类结果(The matlab program of clustering iris samples by K-means clustering, including source code, sample data and clustering results)