基于Hadoop云计算平台的海量数据挖掘研究与应用

2019年11月13日 科技成果发布与展示

研发人:姚正安

数学学院

本研究低成本搭建了弹性可扩展的Hadoop云计算平台,大幅度提升了海量数据的计算能力。结合决策树、贝叶斯等经典数学算法,创造性建立了面向市场应用的客户指纹识别、客户流失预警等电信领域核心模型,提升了模型精准度,并依托Hadoop云计算平台创新性解决了模型的算法实现,快速有效地支撑了市场营销和决策。

1.利用客户交往圈的独特性,建立基于MapReduce的客户指纹多维向量,并采用决策树C5.0算法衡量客户多维向量的相似性及相异性,综合判别两个客户指纹是否为同一个客户。本模型的客户识别准率达90%以上。

2.创造性建立了基于MapReduce贝叶斯算法的客户流失预警模型,采用贝叶斯分类算法预测客户流失高风险群体。本模型预测准确率达62%以上。

3.创新性利用Hadoop技术实现海量客户位置数据的分布式计算,解决了海量数据计算难题,提高了对客户活动区域定位的效率,时间比原算法缩短92%。


Copyright©2015-2021 中山大学国家大学科技园 粤ICP备17075193号-1  粤公网安备44010502000615号