资源列表
iris_data
- Iris Data Set(鸢尾属植物数据集)是我现在接触到的历史最悠久的数据集,它首次出现在著名的英国统计学家和生物学家Ronald Fisher 1936年的论文《The use of multiple measurements in taxonomic problems》中,被用来介绍线性判别式分析。在这个数据集中,包括了三类不同的鸢尾属植物:Iris Setosa,Iris Versicolour,Iris Virginica。每类收集了50个样本,因此这个数据集一共包含了150个样本。
爬取豆瓣电影Top250
- 通过python语言,利用爬虫、词云等模块,爬取豆瓣电影评分前250(Climbing the top 250 of Douban Movie)
利用Python进行数据分析
- 数据挖掘python语言的学习资料,包括常用算法的实现和工具的使用(Data Mining Pthon Language Learning Materials, including the Implementation of Common Algorithms and the Use of Tools)
python源代码
- python入门到实践本书的相关资料,有源代码以及相关数据集
新闻言论自动提取
- 根据新闻的内容,在线提取言论实体与发表的观点,利用哈工大的pyltp语言模型对输入的新闻进行分句、分词、命名实体识别,判断新闻是否存在实体,对包含实体的内容进行依存句法分析,若谓语存在相似词列表中,则后面句子为观点内容。
社区划分算法模块度函数计算
- 上世纪60年代,Herbert Simon 首先提出了复杂系统具有模块结构特性的概念。而针对社区的研究实际上是从子图分割问题演化而来,Kernighan-Lin 提出的二分算法使得子图分割问题逐渐成为当时图挖掘领域关注的重点。另外,在社会学领域,社会学家也发现社区结构在各种复杂网络中的普遍存在性。进入21世纪后,社区的研究开始被研究者所重视,而近年来随着社交网络的崛起,这一领域的关注度已大大提升。使用时讲后缀名改为py,python打开
主动学习文献综述
- 适合主动学习入门者阅读,主动学习文献综述,有助于对主动学习的了解和学习
基于c#的学生管理系统
- 该项目是基于c#开发的一款学生管理系统,在系统中应用了很多第三方插件元素,可以作为入门学生使用,在系统中功能完善还有待提高,欢迎指导。
汽车识别
- 可用作汽车识别的python文件,同时获取汽车的图片
python机器学习
- python机器学习Chapter1.4的示例代码。使用jupyter notebook。python2.
KNN01
- 用来作分类识别的KNN算法,非常好用非常好用(A very useful nearest neighbor algorithm)
Decision_tree-python
- 使用决策树(包括ID3,C45,CART)对数据做多分类预测。(Use Decision Tree to classify.)