在当今以客户为中心的商业环境中,企业面临着如何满足不同客户群体多样化需求和偏好的挑战。这不仅关系到如何识别和定位目标客户群体,还涉及到制定合适的市场策略。客户细分是解决这一问题的关键。本文将探讨客户细分后的客户画像分析,包括如何使用Python构建客户画像以及如何解读分析结果。
客户画像分析是指根据关键绩效指标(KPIs)或变量来区分不同客户群体的过程。例如,通过比较不同群体的平均收入,可以发现某些群体收入较高,而另一些群体收入较低,从而根据收入水平区分不同的客户群体。客户画像分析的目标是识别出具有独特特征的群体,这些群体是理想的细分市场解决方案。
执行客户画像分析通常包括以下步骤:
将使用信用卡客户数据来在Python中实现客户画像分析。数据集和代码可以从GitHub仓库获取。数据集包含以下属性:
CUST_ID: 信用卡持有者ID
BALANCE: 月平均余额(基于每日余额平均值)
BALANCE_FREQUENCY: 最后12个月有余额的比率
PURCHASES: 过去12个月的总消费金额
ONEOFF_PURCHASES: 一次性购买的总金额
INSTALLMENTS_PURCHASES: 分期购买的总金额
CASH_ADVANCE: 总现金预借金额
PURCHASES_FREQUENCY: 购买频率(至少有一次购买的月份百分比)
ONEOFF_PURCHASES_FREQUENCY: 一次性购买频率
PURCHASES_INSTALLMENTS_FREQUENCY: 分期购买频率
CASH_ADVANCE_FREQUENCY: 现金预借频率
AVERAGE_PURCHASE_TRX: 每次购买交易的平均金额
CASH_ADVANCE_TRX: 每次现金预借交易的平均金额
PURCHASES_TRX: 每次购买交易的平均金额
CREDIT_LIMIT: 信用额度
PAYMENTS: 期间内总付款(客户为减少其对账单余额而支付的金额)
MINIMUM_PAYMENTS: 期间内最低付款总额。
PRC_FULL_PAYMENT: 完全支付对账单余额的月份百分比
TENURE: 作为客户的月份数
在完成所有预处理步骤、构建新的KPIs和派生变量后(提取了每个客户进行的购买类型的新特征),数据集如下所示:
import pandas as pd
original_df = pd.read_csv('CC_GENERAL.csv')
print(original_df.head())
使用K-Means和层次聚类技术,从k = 4到8找到了多个解决方案,以找到最优的聚类。在执行聚类后,观察到所有指标:轮廓系数、肘部方法和树状图都显示k = 4或k = 5的聚类看起来非常相似,因此现在使用客户画像分析将找到哪个聚类是最优解决方案,并且检查不同群体之间的相似性和差异性。
客户画像分析的结果如下所示(由于空间限制,仅显示六个聚类):
聚类 | 群体 | 平均收入 | 平均消费 | 平均信用额度 | ... |
---|---|---|---|---|---|
1 | 初学者 | 低 | 低 | 中等 | ... |
2 | 高风险 | 高 | 低 | 高 | ... |
3 | 中等消费 | 中等 | 中等 | 低 | ... |
4 | 大额消费 | 高 | 高 | 非常高 | ... |
5 | 罕见购买者 | 低 | 非常低 | 低 | ... |