聚类分析是一种将一组对象分组的任务,使得同一组(称为一个聚类)中的对象在某种意义上比其他组(聚类)中的对象更相似。以下是一个基于美国人口的收入和债务寻找聚类的示例图:
聚类分析是工业中广泛使用的一种主观建模技术。常见的聚类应用之一是基于人口统计、交易行为或其他行为属性的客户组合细分。
尽管决策树等客观建模技术在分析行业占主导地位,但聚类技术因其生成自然聚类且不依赖于任何驱动目标函数而具有优势。因此,这样的聚类可以用来分析不同目标属性的组合。例如,如果一个决策树是基于未来3个月内的客户盈利能力构建的,这种细分就不能用于制定每个细分的保留策略。如果细分是通过聚类开发的,那么保留和盈利能力策略都可以建立在这些细分上。
因此,聚类通常用于对组合进行初步分析。在对组合有了良好的理解之后,使用客观建模技术构建特定策略。
在统计学中,有许多算法可以生成聚类,但将详细讨论两种在行业中广泛使用的技术:
层次聚类从个体数据点开始,依次将它们组合起来以找到最终的聚类,而k-means聚类从一些初始聚类开始,然后尝试重新分配数据点到k个聚类中以最小化总惩罚项。因此,对于大量的数据点,k-means使用的迭代次数远少于层次聚类。
讨论了聚类分析及其类型后,让将这些概念应用于一个商业案例。以下是一个尝试解决的简单案例:美国银行X希望了解其客户基础的概况,以构建针对性的活动。
如所见,使用聚类可以更好地了解组合。还可以利用每个聚类的概况构建针对性策略。在本文的第二部分,将讨论: