统计学在商业决策中的应用

在商业领域,统计学是一个强大的工具,它帮助组织基于数据做出战略决策。由于获取整个总体的数据往往不切实际,通常依赖于样本来估计总体参数。例如,产品公司经常通过市场调查服务收集数据,然后利用这些数据来更好地设计他们的产品。基于样本信息,可以对整个客户基础得出结论。

estimator是从样本数据中计算出的任何量,用于提供有关总体中未知量(estimand)的信息。例如,平均客户满意度。而estimate是通过对特定样本数据获得的估计器的特定值,用来指示参数的值。例如,在调查后发现,平均客户满意度为7分,满分为10分。

估计结果可以表示为一个单一数字,但如果结果被描述为一个范围,包括最小值和最大值以及概率,可能更容易让利益相关者理解。Point Estimation是尝试提供对某些感兴趣量的单一最佳预测。在示例中,平均客户满意度或样本数据的客户评分均值是一个点估计,即它只是一个给出估计的单一数字。

Interval Estimation涉及计算一个区间或值的范围,在该范围内参数最有可能被定位。例如,说有95%的概率平均客户满意度位于6到8的区间内。平均客户满意度,估计器,是一个random variable,它依赖于从样本中提取的信息。对于第一个样本,它的估计值或值是7。对于第二个样本,它可能是6。

理想情况下,可以考虑所有可能的样本对应于给定的抽样策略,并得到一个概率分布。概率分布不过是将所有可能结果的列表与它们的概率之间的映射。对于一个离散随机变量X(客户满意度:{1,2,…10}),它取有限数量的可能值,确定所有可能值的XP(X=x),并称之为probability mass function (PMF)

所有可能样本的平均客户满意度估计是一个连续随机变量,可以为所有不同的估计构建一个probability density function。有关PDF的详细信息,请参考这篇文章。通过特别查看估计器的抽样分布的汇总度量,尤其是其均值和方差,可以很好地了解所讨论的估计器预期的性能如何。例如,如果估计器的期望值等于感兴趣的参数,那将是有用的。

估计器的expected value是所有样本的所有可能值的估计器的平均值,按它们的概率加权。如果让theta hat作为theta的估计器,那么theta hat的偏差是theta hat的期望值或均值与真实值或总体参数theta之间的差异。这是平均估计值集合与被估计的单一参数之间的距离。

由于期望值在图中,如果抽样程序重复多次,那么对于无偏估计器,平均估计值将等于总体参数。无偏性是一个必要条件,但它不足以使估计器最理想。

估计器的variance仅仅是平方抽样偏差的期望值。它用于指示平均估计值集合与估计值的期望值之间的距离。如果估计器具有围绕真实值的低程度分散的概率分布,则该估计器是有效的。在可以获得的不同无偏估计器中,选择方差最小的那一个,即估计器B。

均方误差(MSE)是一种简单的方法,用于权衡偏差和方差,并比较估计器。它用于指示平均估计值集合与被估计的单一参数之间的距离。上述的MSE、方差和偏差的偏差-方差分解表明,MSE、方差和偏差是相关的:即均方误差 = 方差 + 偏差的平方。特别是,对于无偏估计器,方差等于MSE。

在点估计示例中,可以通过平均样本数据来估计总体的客户满意度,并得到平均客户满意度的估计。现在想要预测客户满意度。客户满意度可能受到许多因素的影响,如产品价格、购买日期、交货日期、订单运费比率等。现在需要找到一种方法,根据这些产品和订单数据来估计客户评论或满意度评分。

X:独立的输入变量或预测变量,如价格、交货所需天数等。Y:依赖的或响应变量 - 客户满意度。由于Y依赖于因素X,存在一个可以假设为X的函数和一些随机误差e的关系:Y = f(X)+e。在函数估计中,尝试用模型近似f或估计。目标是基于样本观察创建一个准确的数据模型,然后使用该方程来预测未见于估计阶段的新数据的响应。

这也被称为统计学习或机器学习,更具体地说是监督学习。学习算法及其参数配置尝试从所有可能的函数集合中猜测假设函数。可减少误差是由于f之间的不匹配而产生的误差。fXY之间的真实关系,但不能直接看到f - 只能估计它。可以通过应用改进的方法来减少估计和真实函数之间的差距。可减少误差再次分为两种类型:偏差和方差。

沪ICP备2024098111号-1
上海秋旦网络科技中心:上海市奉贤区金大公路8218号1幢 联系电话:17898875485