关键词:
潜在购车用户
特征指标体系
用户分类
新能源
xgboost模型
随机森林
摘要:
随着互联网技术的进步以及中国新能源汽车行业的蓬勃发展,社交媒体平台上的用户数量以及新能源汽车用户群体均呈现出快速增长的趋势。用户在网络平台上进行车辆选择和购买的行为日益普遍,这为研究人员及企业提供了探索消费者价值的新途径。在汽车行业的营销与管理体系中,理解消费者购车的驱动因素对于实施精细化营销策略和提升客户价值具有至关重要的意义。所以,本文通过对新能源汽车论坛进行分析,识别影响用户购车的各种因素,并集成三种机器学习的分类方法对潜在购车用户进行分类,并针对不同类别的用户提出相应的营销建议。
本研究在新能源汽车领域研究现状的基础上,提出了一种新的基于论坛数据的潜在购车用户分类方法。该方法的主要步骤包括以下五个部分:首先,从比亚迪新能源汽车论坛获取相关数据并进行必要的预处理工作;接着,从用户行为、论坛文本内容和用户属性三个维度构建特征指标体系,并应用层次分析法和熵值法来确定特征的权重并进行筛选;然后,使用经过筛选和加权处理的特征矩阵对潜在购车用户进行分类,以识别不同购车意愿的用户群体;在此基础上,根据不同用户群体的特性制定针对性的营销策略;最后,对于新能源汽车论坛的新用户,通过将他们的特征矩阵输入分类模型,将其归入特定的用户群体,以便进一步分析他们的购车意向。
本文选择汽车之家的比亚迪新能源汽车论坛作为研究对象,通过编写爬虫程序获取了20357个用户和39470条文本数据,进行数据预处理后得到16218个用户和30156条文本数据,利用新能源汽车潜在购买用户识别方法从中筛选出11029个潜在购买用户。接着利用构建特征指标体系的方法从行为、文本和属性三个方面分别得到23维、7维和3维的特征,再用特征筛选的方法从中选出权重较高的17维特征作为用户聚类的基础。采用k-means聚类方法将11029个潜在购车用户聚成三类,并采用LDA主题模型提取每类用户文本主题词,从用户行为、用户文本总结每类用户特点,根据每类潜在购车用户的特点提出了相应的营销建议。最后,利用分好类别的用户集分别训练随机森林、KNN和xgboost等分类模型,并提出一种新的集成分类模型——rfc-knn-xgboost模型,对比其分析结果,显示集成分类模型的评价指标最高,因此采用集成分类模型用于新用户的分类,并根据其特点分析购车意愿以及针对各类用户制定相应的营销策略。
本文将新能源汽车购车意愿的研究成果和数据挖掘领域的机器学习技术相结合,提出了一种新的集成分类模型——rfc-knn-xgboost模型以及基于汽车论坛数据的潜在购车用户分类策略,研究成果不仅拓展了新能源汽车论坛用户数据挖掘的研究范畴,而且为新能源汽车行业的市场营销和管理提供了重要的参考价值。