博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《贝叶斯思维:统计建模的Python学习法》——1.7 Monty Hall难题
阅读量:6452 次
发布时间:2019-06-23

本文共 1686 字,大约阅读时间需要 5 分钟。

本节书摘来异步社区《贝叶斯思维:统计建模的Python学习法》一书中的第1章,第1.7节,作者:【美】Allen B. Downey,更多章节内容可以访问云栖社区“异步社区”公众号查看

1.7 Monty Hall难题

蒙蒂大厅(Monty Hall problem)难题可能是历史上最有争议的概率问题。问题看似简单,但正确答案如此有悖常理以致很多人不能接受,很多聪明人都难堪于自己搞错了反而据理力争,而且是公开的。

蒙蒂大厅是游戏节目“来做个交易”(Let’s Make a Deal)的主场。蒙蒂大厅难题也是这一节目的常规游戏之一。如果你参加节目,规则是这样的:

蒙蒂向你示意三个关闭的大门,然后告诉你每个门后都有一个奖品:一个奖品是一辆车,另外两个是像花生酱和假指甲这样不值钱的奖品。奖品随机配置。

游戏的目的是要猜哪个门后有车。如果你猜对了就可以拿走汽车。
你先挑选一扇门,我们姑且称之为门A,其他两个称为门B和门C。
在打开你选中的门前,为了增加悬念,蒙蒂会先打开B或C中一个没有车的门来增加悬念(如果汽车实际上就是在A门背后,那么蒙蒂打开门B或门C都是安全的,所以他可以随意选择一个)。
然后蒙蒂给你一个选择。坚持最初的选择还是换到剩下的未打开的门上。
问题是,你应该“坚持”还是“换”?有没有区别?

大多数人都有强烈的直觉,认为这没有区别。剩下两个门没有打开,车在门A背后的机会是50%。

但是,这是错的。事实上,如果你坚持选择门A,中奖概率只有1/3;而如果换到另外一个门,你的机会将是2/3。

运用贝叶斯定理,我们可以将这个问题分解成几个简单部分,也许这样可以说服自身,“正确”的答案实际上的的确确是对的。

首先,我们应该对数据进行仔细描述。在本例中为D包括两个部分:蒙蒂打开了门B,而且没有车在后面。

接下来,我们定义了三个假设:A,B和C,表示假设车在门A,门B,或门C后面。同样,采用表格法:

9e0539e9537a1a750b55d3789239a8c060b46444

填写先验很容易,因为我们被告知奖品是随机配置的,这表明该车可能在任何门后面。

定义似然度需要一些思考,在充分合理的考虑后,我们确信正确的似然度如下:

考虑假设A:如果汽车实际上是在门A后,蒙蒂可以安全地打开门B或门C。所以他选择门B的概率为1/2。因为车实际上是在门A后,也就是说车不在门B后的概率是1。

考虑假设B:如果汽车实际上是在门B后,蒙蒂不得不打开门C,这样他打开门B的概率就是0(译注:也就是这个假设的似然度为0,不可能发生)。
最后考虑假设C:如果车是在门C后,蒙蒂打开门B的概率为1,发现车不在那儿的概率为1(译注:因为在选手已经选了A门这个情况下,可供蒙蒂增加悬念开门的选择只有B和C,而假设C有车,蒙蒂肯定不会选,因此蒙蒂会打开B门的概率为1,也就是在这个假设下,数据D的似然度为1)。
现在我们已经完成有难度的部分了,剩下无非就是算术。第三列的总和为1/2,除以后得到p(A|D) = 1/3,p(C|D) = 2/3,所以你最好是换个选择。

该问题有许多变形。贝叶斯方法的优势之一就是可以推广到这些变形问题的处理上。

例如,设想蒙蒂总是尽可能选择门B,且只有在迫不得已的时候才选门C(比如车在门B后)。在这种情况下,修正后的表如下:

aa08857c8fc6b10aad98fbf061f28eae95bd1549

唯一的变化是p(D|A)。如果车在门A后,蒙蒂可以选择打开B或C。但在这个变形问题里面,他总是选择B,因此p(D|A) = 1。

因此,对A和C,似然度是相同的,后验也是相同的:p(A|D) = p(C|D) = 1/2,在这种情况下,蒙特选择B 门显示不了车位置的任何信息,所以无论选手选择坚持不变还是改变都无关紧要。

反过来的情况下,如果蒙蒂打开门C,我们就知道p(B|D) = 1(译注:因为蒙蒂总是优先选择门B,而门D是他打开了门C,因此在假设车在门B后的前提下,他必然会打开门C,概率为1,即p(B|D)=1)。

本章中我介绍了蒙蒂问题,因为我觉得这里有它的趣味性,也因为贝叶斯定理使问题的复杂性更易控制。但这并不算是一个典型的贝叶斯定理应用,所以如果你觉得它令人困惑,没什么好担心的!

转载地址:http://rtwzo.baihongyu.com/

你可能感兴趣的文章
ASP.NET完整打包卸载更新攻略(By Installshield 2010)
查看>>
[120_移动开发Android]006_android开发之数据存储之sdcard访问
查看>>
[若有所悟]IT小兵总结IT人特点及挽留IT人才的九大策略
查看>>
概率图模型建模、学习、推理资料总结
查看>>
【转】知道这20个正则表达式,能让你少写1,000行代码
查看>>
自定义 启动和关闭 oracle 的命令
查看>>
用ASP.NET Core 2.0 建立规范的 REST API
查看>>
SQLite数据库、ListView控件的使用
查看>>
Storm程序的并发机制(重点掌握)
查看>>
Quartz
查看>>
正则表达式介绍
查看>>
初识Scala反射
查看>>
第三十九天
查看>>
Redis详解
查看>>
4Sum——LeetCode
查看>>
论程序员加班的害处
查看>>
codeblocks快捷键
查看>>
基于HTML5的WebGL设计汉诺塔3D游戏
查看>>
WPF资料链接
查看>>
过滤DataTable表中的重复数据
查看>>