生日相同的人的概率
足球比赛时,两队选手22人、主裁1人、边裁2人,其有25人在场上。其中同一天出生的人的概率是多少呢?
结果是令人惊讶的:57%。考虑到1年有365天,要想遇到生日相同的人再怎样不是也需要聚集366个人吗?所以这个结果的确很难让人相信。
计算这个概率时,可能会出现2人相同的情况,也可能会有3人或4人相同的情况,因为生日相同的人可能会有很多,计算起来就十分复杂。这时候,相反地去考虑生日全都不同的情况就会很简单了。
对第一个人没有任何制约。第二个人的生日与第一个人不同的几率是364365,第三个人与前面两个人不同的几率是363365。照此计算,那么25人的生日全不同的概率的计算方法为364365×363365×362365……×341365,计算结果约为0.43。所以25人中会出现一对生日相同的人的概率是1减去0.43,结果等于0.57。
概率这么高的原因是,能让生日相同的“符合情况的数”多的缘故。在人员为25人时,选择生日相同的2人的方法有300多种,而选择3人或4人的时候就会更多了。
因此,随着人员增加,这一概率也会急速地增长,聚集到30人的时候,生日相同的概率竟然达到70%。
蒙蒂霍尔的二推难题
概率是研究“不难定性”的领域,因此,一般情况下,人们的直观判断和数学概率的计算结果经常会有很大的差异。最具代表性的例子就是“蒙蒂霍尔的二推难题”。这个通过美国电视节目《让我们交易吧》(let’s make a deal)而闻名的问题的内容如下(如图37):
有3个门,其中1个门后面有1辆轿车,剩下的2个门后面各有1只山羊。参加者如果选择有轿车的门,那么就可以得到那辆车,如果选择有山羊的门,那么什么都得不到。
在A、B、C3个门,如果参加者选择A的时候,B、C中至少有1个门后面有山羊。事先知道哪个门后面有车,哪个门后面有山羊的主持人,会把有山羊的门打开给参加者看,然后会问:“是选择原来的那个,还是要换另一个?”这个时候,选择哪个门会更有利呢?
是否要更换已选择的门?
简单地想,因为剩下的2个门当中肯定有1个门后面有车,所以概率好像应该是12。但是仔细分析的话,原来的门后面有车的概率是13,而别的门后面有车的概率就会变为23,所以重新选择会更有利。为什么会这样呢?以下我们就对这个问题进行详细讨论:
门A门B门C坚持选择A时的结果
轿车山羊山羊中奖
山羊轿车山羊空
山羊山羊轿车空
3个门中,1个门后面有轿车,其他2个门后面有山羊的情况有以下3种:选择A门后,不换选择的情况下,它的概率为13。
门A门B门C主持人开的门参加者的选择重新选择时的结果
轿车山羊山羊门B门C门A→门C门A→门B空
山羊轿车山羊门C门A→门B中奖
山羊山羊轿车门B门A→门C中奖
参加者在选择A门的情况下,当主持人打开B或C中有山羊的门,那么,参加者将在剩下的门中选择一个。就会如下表所示,如果参加者选择另一个门,那么他的中奖概率将会变成23。
IQ228的回答
这个问题被收进杂志《商店街》中一个叫“去问玛丽莲”的专栏里,以IQ228而获得吉尼斯IQ纪录的玛丽莲·佛斯·萨万特对此进行了回答。她说如果重新选择,中奖的概率会从13提高到23,所以,重新选择会更有利。据说她因此收到了很多抗议信。
“蒙蒂霍尔的二推难题”曾在美国引起相当大的争论。基于人们直观的预测和实际概率之间的“乖离”增加了概率的魅力,但同时,它也使概率成为一个让人感到陌生的领域。
墨菲法则和萨里法则
一提到概率,人们自然而然就会想到墨菲法则和萨里法则。美国的航空工程师墨菲在做缓冲实验时失败之后说道“任何可能出错的事经常会出错”,墨菲法则也因此而得名。
与墨菲法则相反的是以电影《当哈里遇上萨里》的女主人公名字命名的萨里法则。萨里法则指是的:任何可能成功的事情往往会成功。
比如,如果发生概率为1%的不幸事情接连发生,那么,它就相当于墨菲法则;相反,发生概率为1%的好事情接连发生,那么它就相当于萨里法则。
O·J·辛普森事件的判决
由于情况不同,求概率的方法也多种多样,因此概率常常会引发争论。
如果大家看看被誉为世纪审判的“O·J·辛普森事件”,就会深有同感。美式足球选手O·J·辛普森的妻子被杀,而他是最大的嫌疑人。一般来说,DNA分析结果雷同的概率是万分之一,在被杀现场所取的DNA与O·J·辛普森的一致。以此为依据,检察官认为O·J·辛普森涉嫌杀人的概率是99,99%。
但是,O·J·辛普森的辩护律师却认为:在邻近的300万人口中,拥有同一DNA的人有300人,O·J·辛普森只是这300人当中的1人,所以,他是犯人的概率只有0.33%。检察官与辩护律师各执一辞,是注重了两个不同侧面的概率的结果,但是陪审团还是倒向辩护人一方。这一审判,因为O·J·辛普森是黑人,而他的夫人是白人,上升为种族问题,进而把整个美国卷入了一场“黑白攻防战”。
O·J·辛普森的悖论
把概率弄得令人费解的是关于概率的各种悖论,其中有一种叫“辛普森悖论”。和前边所提到的O·J·辛普森没有关系,但巧合的是,两个人都叫辛普森。
1970年,美国加州伯克利大学,曾做了一个按性别划分的学业合格率调查。按单个学科计算,女生的合格率很高,但在总体的合格率上,女生却比男生低,这是在实际生活中产生的悖论。举个例子,比如某大学工学部和食品营养学科分别招了900名和100名学生。假定志愿者性别数和合格者性别数如下表:
区分定员男学生人数女学生人数
志愿者合格者合格率志愿者合格者合格率
工学部90090072080%20018090%
食品营养专业1001001010%8009011.3%
全体1 0001 00073073%1 00027027%
从表中我们可以了解到:工学部和食品营养学科中,女生的合格率都比男生的合格率高,但是从总的合格率来看,男生73%的合格率远远超过女生的合格率27%。
在各个招生单位,均显示女生合格率比男生高,所以我们很容易认为,在总体上也会如此。可是,在概率上这种思想当然是不成立的。
疾病检查的正确率
把某种疾病的检查结果用概率进行解释时,也会碰到一些意外的情况。例如,我们假定检查感染病毒方法的正确率为99%,如果感染者与未感染者的人数相差极大时,这一概率就会动摇。
假设在我国,实际感染病毒的人数只有3 000人,而全国人口为5 000万,把检查疾病的正确率假定为99%并做如下分析。
区分确诊为感染人数确诊为未感染人数全部人数
实际感染者2 970303 000
实际未感染者499 97049 497 03049 997 000
全部人数502 94049 497 06050 000 000
实际上,在感染者中,通过检查被判定为感染者的人数是3000人的99%,即2 970人;1%的30人被视为判定错误,应为未被感染者。另一方面,实际未被感染的49 997 000的人99%即49 497 030名被正确地判写为未被感染者,但是余下的1%即499 970人却被误诊为被感染者。
这样分析话,实际真正感染者的概率为2970/502 940,即只有0.6%而已。因此,在临床上得到相关结果时,为了确保其诊断的准确度,都还会再使用其他检查方法进行复查。
99%和0.6%这两个数据存在着天壤之别。如果被确诊为感染者,我们可能会想起“墨菲法则”,反之我们则会想到“萨里法则”,这么看来,概率就好似“悲喜双曲线”。