关键词:
因果推断
因果效应估计
精准营销
用户分类
摘要:
在工业4.0进程的推动和互联网大数据等领域的快速发展下,精准营销成为提升传统行业效益的重要手段。因果推理通过分析变量间的因果关系,为优化营销策略提供了新的思路。然而,现有的深度学习方法受限于混杂变量和选择偏差,难以准确捕捉用户行为的因果效应估计值。针对上述问题,本文结合因果推理与深度学习技术,围绕精准营销中的因果效应估计和用户分类问题展开研究。提出一个利用观测变量提升因果效应估计精度模型并开发对应系统。本文在多个公开和真实数据集上验证了方法的有效性,具体研究内容如下:
(1)针对因果效应估计中存在的混杂变量导致倾向得分分配不均,以及数据集样本数量差距过大使实验组和对照组信息交互不充分的问题。因此,本文提出了一个基于去混杂倾向得分的多任务因果效应估计方法DCENet。该模型通过设计去混杂倾向性得分模块DAPN和动态因果模块DCIM,运用多变量任务计算,从结构的角度构建因果效应的计算过程,同时提高个体因果效应ITE的预测精度。DAPN通过界定倾向得分范围缓解混杂变量干扰得到样本更精确的倾向得分,DCIM通过动态联合训练提升模型对处理组和对照组信息的利用效率。在三个公开数据集上的相关指标结果表明,DCENet分别优于传统基线模型8.2%、6.2%和17.7%。
(2)根据第三章的因果效应估计成果对真实数据集的营销场景,提出了一个基于因果效应估计的用户分类模型CGL。该模型针对样本不平衡和传统机器学习精度不足等问题引入因果增强的梯度单侧采样算法,通过结合ITE加权梯度改进了Light GBM算法,优先关注因果效应显著的样本,进而优化了互斥特征捆绑及标签生成过程。在J银行三个时间段的数据集上进行实验验证,结果表明CGL在精确率和召回率上均优于基线方法,提高了营销名单的生成质量,为下游营销环节提供了支持,给银行类似任务提供了方法参考。
(3)针对上述应用流程的需求,在前期工作的基础上设计并实现了一个基于因果效应估计的营销用户推荐系统。系统采用前后端分离架构,提供前端可视化交互界面、多种因果效应估计方法和分类方法选择。该系统实现了数据上传、模型选择、参数调优和结果导出等功能。