导读:本文将从条件概率下手,介绍事情之间独立性的相关概念,然后引出全概率公式和贝叶斯公式的基本内容,带领读者经过概率的视角开端认知实践国际。

作者:张雨萌

来历:篇章科技01 从概率到条件概率关于概率,信任咱们都不会感到生疏,比方掷骰子这个最简略的概率场景,掷出的点数为5的概率是多少?咱们会毫不犹豫地说出答案:概率为1/6。

这个问题太简略了,假定咱们只满意于此,就没有什么研讨含义了。接下来我给这个问题添加一个限制条件:已知掷出骰子的点数是奇数,再求投掷点数为5的概率是多少。发现了没有,这个问题中咱们没有直接问投掷出5这个事情的概率,而是添加了一个已知点数为奇数的条件。

日子中这类场景更多见,咱们一般不会直接去揣度一个事情产生的或许性,由于这样做的实践含义并不大,而且也不简略揣度出成果。一般来说事情是不会孤立产生的,都会随同其他一些条件。比方,我问你下雨的概率是多少。你或许会一头雾水,什么地址?什么时间?当日云层的厚度是多少?揣度的条件条件都没有,是无法给出一个有含义、有价值的揣度成果的。

因而,在实践运用中,咱们更关怀条件概率,也便是在给定部分信息的根底上,再对所重视事情的概率进行揣度。这些给定的信息便是事情的附加条件,是咱们研讨时所重视的要点。02 条件概率的详细描绘咱们先来详细描绘一下条件概率:假定知道给定事情B现已产生,在此根底上期望知道另一个事情A产生的或许性。此刻咱们就需求结构条件概率,先顾及事情B现已产生的信息,然后再求出事情A产生的概率。

这个条件概率描绘的便是在给定事情B产生的状况下,事情A产生的概率,咱们把它记作P(A|B)。

回到掷骰子的问题:在掷出奇数点数骰子的条件下,掷出点数5的概率是多少?奇数点数一共有{1,3,5} 3种,其间呈现5的概率是1/3。很明显,和独自问掷出点数5的概率核算成果是不同的。

下面咱们来笼统一下条件概率的运用场景。

回到最简略、最简略了解的古典概率形式进行剖析:假定一个试验有N个或许成果,事情A和事情B别离包括M1个和M2个成果,M12表明公共成果,也便是一起产生A事情和B事情,即事情A∩B所包括的试验成果数。

经过图1-1再来形象地描绘一下上述场景。▲图1-1 事情和事情一起产生的场景

事情A和事情B独自产生的概率别离是多少?读者肯定能信口开河,别离是M1/N和M2/N。那么再考虑条件概率:在事情产生的条件条件下,事情产生的概率是多少?

此刻,咱们的考虑规模由最开端的N个悉数或许成果,缩小到现在的M2个成果,即事情B产生的成果规模,而这其间只要M12个成果对应事情A的产生,不难核算出条件概率P(A|B)=M12/M2。

03 条件概率的表达式剖析为了愈加深化地发掘这儿面的内在,咱们进一步对条件概率的表达式P(A|B)=M12/M2进行打开,式子上下部分一起除以悉数或许的成果数:由此,咱们得到了条件概率的一般界说:P(A|B)=P(AB)/P(B)。

04 两个事情的独立性咱们进一步剖析上面的比如,事情A的无条件概率P(A)与它在给定事情B产生下的条件概率P(A|B)明显是不同的P(A|B)≠P(A),即,而这也是十分遍及的一种状况,无条件概率和条件概率的概率值一般都存在差异。

其实,这种状况也反映了两个事情之间存在着一些相关,假定满意P(A|B)>P(A),则能够说事情B的产生使得事情A产生的或许性增大了,即事情B促进了事情A的产生。

可是P(A)=P(A|B)的状况也是存在的,而且这是一种十分重要的状况,它意味着事情B的产生与否对事情A是否产生毫无影响。这时,咱们就称A和B这两个事情独立,而且由条件概率的界说式进行转化能够得到:实践上,咱们运用以上表达式描写事情独立性,比单纯运用P(A)=P(A|B)要更好一些,由于P(AB)=P(A)P(B)不受概率P(B)是否为0的要素限制。

由此可知,假定A和B这两个事情满意P(AB)=P(A)P(B),那么称事情A和事情B独立。

05 从条件概率到全概率公式咱们假定B1,B2,B3,...,Bn为有限个或无限可数个事情,它们之间两两互斥且在每次试验中至少产生其间一个,如图1-2所示。▲图1-2 事情两两互斥且每次试验至少产生其间一个

用表达式描绘:现在咱们引进另一个事情A,如图1-3所示。▲图1-3 在试验中引进事情A

由图1-3可知,由于Ω是一个必定事情(也便是整个事情的全集),因而有等式P(A)=P(AΩ)建立,进一步进行推导有:

P(A)=P(AΩ)=P(AB1+AB2+AB3+...+ABn)。由于事情Bi、Bj两两互斥,那么明显AB1,AB2,AB3,...,ABn也两两互斥,所以就有:

P(A)=P(AB1)+P(AB2)+P(AB3)+...+P(ABn)

再将条件概率公式P(ABi)=P(Bi)P(A|Bi)代入:

P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+...+P(Bn)P(A|Bn)

这便是咱们终究得到的全概率公式,“全”字的含义在于:悉数的概率P(A)被分化成了多个部分概率之和。

咱们再回过头来看全概率公式的表达式,能够发现:事情A的概率P(A)应该处于最小的P(A|Bi)和最大的P(A|Bj)之间,它不是一切条件概率P(A|Bk)的算术平均,由于事情被运用的时机权重(即P(Bi))各不相同,因而全概率P(A)便是各条件概率P(A|Bk)以P(Bk)为权重的加权平均值。

06 聚集贝叶斯公式了解了全概率公式之后,咱们进一步处理条件概率的表达式,得到如下等式:这便是大名鼎鼎的贝叶斯公式。

千万不要觉得它平铺直叙,仅仅数学公式的推导和罗列。实践上,这个公式里包括了全概率公式、条件概率、贝叶斯原则。咱们来发掘一下里边所蕴藏的重要内在。

贝叶斯公式将条件概率P(A|B)和条件概率P(B|A)严密地联系起来,其最底子的数学根底便是P(A|B)P(B)=P(B|A)P(A),它们都等于P(AB)。

那这儿面详细的深入内在是什么呢?咱们接着往下看。

07 实质内在:由因到果,由果推因在实践中,咱们能够把事情A看作成果,把事情B1,B2,...,Bn看作导致这个成果的各种原因。那么,咱们所介绍的全概率公式

P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+...+P(Bn)P(A|Bn)

便是由各种原因推理出成果事情产生的概率,是由因到果。

可是,实践上还存在着一类重要的运用场景:咱们在日常日子中常常是观察到某种现象,然后去反推构成这种现象的各种原因的概率。简略来说,便是由果推因。

由贝叶斯公式终究求得的条件概率P(Bi|A),便是在观察到成果事情A现已产生的状况下,揣度成果事情A是由原因Bi构成的概率的巨细,以支撑咱们后续的判别。

概率P(Bi)被称为先验概率,指的是在没有其他条件信息状况下的概率值,这个值一般需求凭借咱们的经历去估量。而条件概率P(Bi|A)被称作后验概率,它代表了在取得“成果事情A产生”这个信息之后原因Bi呈现的概率,能够说后验概率是先验概率在获取了新信息之后的一种批改。

本文从概率动身,到条件概率,再到全概率公式,终究聚集到贝叶斯公式,主要是从概念层面进行整理,协助读者敏捷构成以条件概率为柱石的认知视角。条件概率的重要性显而易见,它将贯穿整个概率核算课程体系。

关于作者:张雨萌,人工智能技能专家,结业于清华大学核算机系,现就职于我国舰船研讨规划中心,长时间从事人工智能范畴相关研讨工作。谙熟机器学习算法运用及其背面的数学理论根底。现在已出书多部机器学习数学根底类热销书本,并当选京东引荐排行榜,广受读者好评。

本文摘编自《机器学习中的概率核算 Python言语描绘》,经出书方授权发布。延伸阅览《机器学习中的概率核算》

引荐语:资深AI技能专家编撰,清华大学结业,GitChat热销专栏晋级,体系解说机器学习中概率核算中心常识和核算技巧。