在人工智能领域,机器学习是一个分支,它通过创建的模型帮助机器从数据中学习,并识别模式以进行预测。如果考虑在数据科学领域发展未来,那么最重要的事情之一就是掌握“概率论”。这篇文章将讨论这个理论,并在讲座结束时让对它充满信心。将讨论所有重要的事情,而不浪费任何时间。
概率论讨论的是事件发生的可能性,其值总是在0和1之间(包括0和1)。例如,考虑有两个袋子,A和B,每个袋子都包含10个红球和10个黑球。如果随机从一个袋子中取出一个球(不看袋子里),肯定不知道将取出哪个球。这就是概率论发挥作用的地方,找到取出黑球或红球的可能性。注意,将从现在开始用P表示概率。P(X)表示事件X发生的概率。
P(红球) = P(袋子A) * P(红球 | 袋子A) + P(袋子B) * P(红球 | 袋子B)
这个方程找到了红球的概率。这里引入了条件概率的概念(在提供条件的情况下找到概率)。P(袋子A) = 1/2,因为有两个袋子,必须选择袋子A。P(红球 | 袋子A)应该读作“给定袋子A的情况下抽取红球的概率”,这里的“给定”词指定了条件,即这种情况下的袋子A,所以它是20个球中的10个红球,即10/20。让来解决这个问题:
P(红球) = 1/2 * 10/20 + 1/2 * 10/20 = 1/2