在预测分析领域,统计学家、机器学习工程师和数据科学家经常使用概率论和统计学中的一些重要概念。本文将详细讨论这些概念及其应用。
切比雪夫不等式,也称为“Bienayme-Chebyshev”不等式,是概率论中的一个基本定理,它保证了对于广泛的分布类别,值超过均值一定距离的比例不会超过某个特定的分数。具体来说,不超过1/k^2的分布值会超过均值k个标准差(或者等价地说,至少1-1/k^2的分布值在均值的k个标准差之内)。
现在,正式定义切比雪夫不等式:
设X为均值为μ,有限方差为σ^2的随机变量,对于任何实数k>0,P(|X-μ| < kσ) ≥ 1-1/k^2 或 P(|X-μ| ≥ kσ) ≤ 1/k^2
这个规则通常被称为切比雪夫定理,它描述了统计学中均值周围的标准差范围。这个不等式非常有用,因为它可以应用于任何定义了均值和方差的分布。例如,它可以用来证明将在本文后面讨论的弱大数定律。
数值示例1:假设已知工厂一周内生产的产品数量是一个均值为50的随机变量。如果一周产量的方差等于25,那么可以说什么关于产量在40到60之间的概率?
步骤1: 均值(μ) = 50, 方差(σ^2) = 25 ⇒ σ= 5
步骤2: 所需概率: P(40 < X < 60) = P(-10 < X-50 < 10) = P(|X-50| < 10)
步骤3: 现在,使用切比雪夫定理,有 P(|X-μ| < kσ) ≥ 1-1/k^2
步骤4: 应用切比雪夫定理找到所需概率: ≥ 1-1/k^2 ≥ 1-(1/4) ≥ 3/4 ≥ 0.75
因此,产量在40和60之间的概率的下限等于0.75。
如果对于任何ε>0,lim n→∞ P(|Xn – α| < ε) = 1 或 lim n→∞ P(|Xn – α| ≥ ε) = 0,那么可以说随机变量序列X1, X2, ——, Xn以概率收敛到α。可以写作Xn -> α as n→∞ in probability。
声明:如果X1, X2, —–, Xn是一系列随机变量,如果Xn的均值μn和标准差σn对所有n存在,并且如果σn ->0 as n→∞,那么Xn-μn -> 0 as n→∞ in probability。
设X1, X2,———, Xn是一系列随机变量,μ1, μ2, ———-, μn是它们各自的均值,设Bn=Var(X1+X2+———-+Xn)<∞。那么,P(|{(X1+X2+———-+Xn)/n} – {(μ1+ μ2———-+μn)/n}| < ε )≥ 1- j
数值示例:假设Xi以相等的概率取值i和-i。证明大数定律不能应用于独立变量X1, X2, ———-。
步骤1: 计算随机变量的均值和方差 E(Xi) = Σ Xi P(Xi) = i/2 – i/2 = 0
步骤2: 计算Bn/n^2当n趋向于无穷大时的极限值
步骤3: 使用WLLN的结果解释结果
步骤4: 应用进一步的测试,例如马尔可夫测试
因此,根据马尔可夫定理,WLLN不能应用于独立随机变量序列{Xi}。