关联分析在不同领域的应用

设想在外地旅行时突然感到饥饿,面前有两家餐厅,但不懂当地语言且没有手机。会选择哪家餐厅?显然,可能会根据顾客的偏好来选择,对吧?话题也是基于类似的想法,但它现在正统治着技术世界,特别是在电子商务领域。让深入了解这个话题。

什么是关联分析?

关联分析是一种预测性分析技术,它通过数据挖掘过程,发现不同变量之间基于它们在数据集中个体或群体中共同出现的隐藏相关性。这种关联分析通过从相对相似的实体中获取知识,为提供了有价值的信息,使能够做出更明智的决策,例如向用户推荐。

关联分析如何与大数据一起工作?

实际上,关联分析在揭示大数据集中隐藏的模式和关系方面引起了很多关注。这些有趣的数据集洞察是通过关联分析和关联规则挖掘的帮助来发现的。

关联规则挖掘的过程涉及寻找属性的频率,并测试这些属性是否满足某些预设的标准,如支持度和置信度。在这个过程中,它找到了具有相似性的特征(例如条件)。它计算了数据集中共同出现的特征的相似性。简而言之,如果预定义条件的特征(X)存在,则具有一定相似性的特征(Y)也存在。

在关联规则挖掘中,第一个特征(X)被称为前件,与具有相当关系的共同出现特征(Y)和其他特征称为后件。这些是基于支持度和置信度在关联规则中定义的。

在关联规则挖掘中,支持度是基于特征集的流行度来定义的,并用于衡量特征之间关系的强度。例如:在给定数据集的10个组合中,产品A出现在5个组合中。因此,产品A的支持度因素是5/10。

置信度范围在0到1之间。在10个组合中,如果发现产品A的置信度值等于1,那么得出结论,产品A参与了所有10个组合。

关联分析的应用领域

关联分析的概念几乎应用于所有领域。使用这种分析的主要目标是“在最小化努力的同时最大化效益”。在本文中,讨论了两个使用关联分析最多的经典领域,即临床诊断和电子商务

从临床试验中获得的病历在创建数据集中的关联规则中起着至关重要的作用。使用关联规则收集的信息有助于发现对药物进行有效诊断的有价值见解。同样,通过分析记录的症状与疾病发生的机会之间的关联,考虑采取预防措施以避免此类疾病的发作。此外,在制药领域,根据各自的试验和在治愈相应疾病中发现的关联,每种特定药物都获得了市场批准。

这是关联分析有效使用最引人注目的领域。在电子商务行业,有一个特定的术语非常流行,这个术语被称为“市场篮子分析”。实际上,这不是一个新过程,关联分析在电子商务领域只是被称为市场篮子分析。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485