搜索资源列表
C4.5
- C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。
apriori
- 经典的Apriori算法由于要多次扫描数据库,产生大量的候选项集,极大的影响了算法的时间和空间效率。为了减少数据库的扫描次数,可采用矩阵记录所需数据并放入内存中。矩阵record的每个行号对应一个商品码(即一个项),每个列号对应一个客户号(即一个事务)。倘若第j个客户买了第i个商品,则record[i][j]=1,否则record[i][j]=0. 扫描一遍数据库,将矩阵record初始化。接下来的工作,都可以通过扫描内存中的矩阵进行,不必再扫描数据库。(The classic Apriori