文章标题:船舶管理中基于负载平衡的并行FP-growth算法研究
文章作者:尚弘1, 徐平平2, 姚湘1
关 键 字:船舶管理;大数据;负载平衡;BPFP-growth;频繁项集
文章摘要:船舶行业数据增长十分迅速,深度挖掘蕴含在大数据中的相关信息,可以有效加强船舶运营的精准化、高效化管理。本文提出一种基于负载平衡的并行FP-growth数据挖掘算法(BPFP-growth)。该算法通过赋予项目TID的方式,对项集树的存储方式进行了改进,基于镜像重构与负载因子完成数据的并行分组,在各自并行分区节点完成相应分组子集的频繁项集的挖掘,通过并集完成全部频繁项集的求解。实验表明,该算法具有较好的可并行性和可扩展性,能够有效实现船舶管理、资源配置等数据的挖掘,进行精准管理,优化资源配置,促进船舶行业高质量发展。