基于划分和压缩数据库的改进Apriori算法

作者: 胡绿慧 ; 任玉兰 ; 何振林

关键词: 数据挖掘 关联规则 压缩数据库

摘要:针对Apriori算法在面对大规模数据时效率较低的问题,提出了一种基于划分和压缩数据库的改进方法。该方法首先依据特征数据出现的频率将数据按照升序存储在临时数组中;然后将原始事务数据库分为几个互不相交的事务数据库,使得子数据库能够容纳在内存中;最后根据每个子数据库计算出的频繁项集计算整个数据库的频繁项集,从而消除了不必要的冗余数据。通过改进可以将大规模数据集进行有效的划分和压缩,对子数据库进行关联规则挖掘。实验结果表明,改进的Apriori算法在针对海量数据挖掘的执行速度和效率都有很大提高。


上一篇:系统核理论在化探异常评价中的稳定性分析及方法改进
下一篇:基于约束粒子群优化的克里金插值算法

核心期刊
中文核心期刊(2014)
中文核心期刊(2011)
中文核心期刊(2008)
中文核心期刊(2004)
中文核心期刊(2000)
中文核心期刊(1992)
成都理工大学版权所有 © 2015  蜀073568422号
地址:成都市二仙桥东三路1号    邮政编码:610059