概率论是统计学和数据分析中的一个基本概念,它描述了事件发生的可能性或机会。概率论的基础是三个基本的公理,这些公理是进一步推理的前提。公理是指大多数人认为正确的规则或原则。本文将详细解释这三个概率公理。
概率论的三个公理构成了概率理论的基础,它们是:
概率论的第一个公理是,任何事件的概率都在0和1之间。1表示事件的任何结果都一定会发生,而0表示事件的任何结果都不可能发生。正如所知,概率的公式是将事件中的总结果数除以样本空间中的总结果数。由于事件是样本空间的一个子集,所以事件不可能比样本空间有更多的结果。显然,这个值将在0和1之间,因为分母总是大于分子。
第二个公理是,整个样本空间的概率等于1。以一个数据集为例,假设需要找出女性客户按职业类型划分的流失概率。在数据集中,有4位女性客户,其中一位是工薪阶层,三位是自雇人士。工薪阶层的女性将会流失。由于只有一位将要流失的工薪阶层女性,所以没有工薪阶层女性客户不会流失。在三位自雇女性客户中,有两位将会流失,可以看到有一位自雇女性不会流失。这是完整的数据集:
// 假设数据集如下:
let dataset = {
SalariedChurn: 1,
SalariedNotChurn: 0,
SelfEmployedChurn: 2,
SelfEmployedNotChurn: 1
};
在这个样本空间中,可以计算出女性客户流失状态的概率,如下:
// 计算概率
let probabilitySalariedChurn = dataset.SalariedChurn / (dataset.SalariedChurn + dataset.SalariedNotChurn);
let probabilitySalariedNotChurn = dataset.SalariedNotChurn / (dataset.SalariedChurn + dataset.SalariedNotChurn);
let probabilitySelfEmployedChurn = dataset.SelfEmployedChurn / (dataset.SelfEmployedChurn + dataset.SelfEmployedNotChurn);
let probabilitySelfEmployedNotChurn = dataset.SelfEmployedNotChurn / (dataset.SelfEmployedChurn + dataset.SelfEmployedNotChurn);
如果将所有这些概率加起来,得到1,这意味着这是整个样本空间,在这里得到的总概率等于1。这引出了第三个公理,与互斥事件有关。
如果记得并集公式,会回想起交集项不在这里,这意味着A和B之间没有任何共同点。让理解这种特殊类型的事件,称为互斥事件。互斥事件意味着这样的事件不能同时发生,换句话说,它们没有共同的值,或者说它们的交集是零/空。也可以这样表示这样的事件:
// 互斥事件的表示
let eventA = {5, 6}; // 掷骰子得到大于4的数字
let eventB = {1, 2}; // 掷骰子得到小于3的数字
显然,这两个事件不能有任何共同的结果。值得注意的是,事件A和B不是彼此的补事件,但它们仍然是互斥的。
另一个重要的概念是穷尽事件,这常常与互斥事件混淆。穷尽事件意味着这样的事件一起构成了随机实验中可能发生的所有事情。这意味着这些事件的并集构成了样本空间。让用一个例子来理解这一点:
// 穷尽事件的例子
let eventC = {3, 4, 5, 6}; // 掷骰子得到大于2的数字
let eventD = {1, 2, 3}; // 掷骰子得到小于4的数字
显然,这两个事件一起构成了掷骰子后可能发生的所有结果。
// 另一个互斥事件的例子
let eventE = {1, 2}; // 掷骰子得到小于3的数字