魔鬼数学意外有趣的故事合集,一本书改变你

白癜风怎么能治好 http://m.39.net/pf/a_6159813.html

而你也许听见过类似这样的回答和反问:

「因为数学在工程、科学上都有用啊,你现在用的手机里都包含了数学。」

「那是工程师、科学家这些人的事情吧?我干吗要知道呢?」

「你喜欢篮球、足球吧,男孩子都喜欢这类体育活动,他们中只有极少的一部分人会成为职业运动员,但是参加这些活动可以让他们的耐力、体力和柔韧性都获得提高。在以后的生活里面,就算被女朋友打的时候,跪搓衣板的时候也能提高自己的『生存率』。其实,学数学也是一样的。学好数学本质上可以为你提供一个全新的思维维度。让你能从一个全新的角度去看待世界,解释这个世界,就好像给你的思维加上了X光一样,让你能从纷繁复杂的日常世界中看到规律。」

「你说的这些听起来还是蛮有道理的,但是太抽象了,你能给我举个例子吗?」

好,我这里举个例子,是亚伯拉罕·瓦尔德(AbrahamWald)的故事。他是一个数学天才,「二战」的时候他加入了哥伦比亚大学的「统计研究小组」,这是一项为「二战」服务的计划,类似于曼哈顿计划。这个小组里面有控制论的奠基人维纳(Wiener),有哈佛统计系的创始人莫斯特勒(Mosteller),有决策理论的先驱萨维奇(Savage),有诺贝尔经济学奖得主弗里德曼(Friedman)。其中,瓦尔德算是研究领域最理论的一个人。这个小组有一次的任务是提高战斗机的生存率。美军发现战场上飞回的那些飞机上的弹孔分布是不均的,机身比引擎上多,他们不能强化整个飞机,因为这样飞机会过重,于是他们觉得要强化受攻击率最高的部位。瓦尔德的建议是强化那些没有弹孔的位置。瓦尔德是这样想的:飞机各个部分的中弹概率是差不多的,那么为什么统计那些飞回来的飞机后发现某些部分弹孔比较多呢?为什么引擎上弹孔比较少呢?因为那些失踪的弹孔在没飞回来的飞机上。军方听从了他的建议,飞机的生存率确实提高了。在这个问题中,瓦尔德实质上运用了数学期望、相关性等数学概念,我会在后面具体解释。

《魔鬼数学》这本书的主要内容就是帮助大家理解「线性关系」、「显著性检验」、「期望」、「回归平均值」等等陌生的数学概念,是如何在社会生活的各个方面具体应用的,通过一个个生动的例子和故事,让数学增加我们认识世界的维度。

全书第一个重点是「线性和非线性」的关系。

不是所有的线都是直线,即使你只是个小学生,你似乎也能理解这个道理。但可惜的是,很多人,甚至是很多专业人士在生活和工作中都非常容易陷入「线性思维」的陷阱。线性思维的错误几乎无处不在。

举个例子,让我们看看《外交》(Foreignaffairs)杂志列出的一段话:「以色列军方报告,从第二次巴基斯坦大起义到年10月底,有个以色列人死亡,人受伤。对于以色列这样的小国,这个数字很大,按照比例来算,相当于美国5万人死亡,30万人受伤」。这种按照比例算的方式随处可见,但是这种「线性推理」是有问题的,非常容易产生谬误。为什么呢?设想一下,如果你下课后把同桌打趴在地,甚至你下手很重,医院,是不是等于全中国7亿人每天被打扒在地了呢?显然不对吧。

我们再举一个现实的例子说明为什么这种线性类比是有问题的。年西班牙马德里火车站发生了恐怖袭击,人丧生,按照比例算是全国人口的百万分之4。按此比例,美国发生类似案件会死人喽。如果按照城市人口比例计算,人对于马德里相当于人之于纽约。但是,我们知道美国火车站恐袭不少,但是从来不会达到这个数字。

当然了,我不是要全盘否定「比例换算」这种方法,方法本身没错,重点是你得用对地方。比如在著名的认知心理学家和科普作家史蒂芬·平克的名著《人性中的善良天使》中,平克就计算了17世纪欧洲「三十年战争」的死亡率,在那次战争中全世界人口的1%死亡,按照比例换算是现代社会的万人,比两次世界大战中死亡的人口都多。他通过计算此类暴力死亡人口的比例发现,人类历史上的暴力水平是下降的。

比例计算能否可靠得看自变量和因变量之间是否是「线性关系」,你当然可以通过严格的逻辑和理论去推理出两个东西是否是线性关系。但是,只是依靠数据也有可能发掘线性关系,其中的一种具体方法叫「线性回归」。比如,我们把北卡莱纳31所私立高校的入学考试分数和学费体现在一张图上。每个点是一个学校,纵坐标代表学费,横坐标是入学考试平均分。于是你会发现大部分的点分布在一条直线附近。倾斜比为28比1,意味着每增长一个平均分,需要多缴纳学费28美元。由此可见,考试辅导是多么昂贵啊!

虽然线性关系简单,但是现实中大部分关系都是非线性的。比如税率和政府财政收入的关系,如果税率很低,当然政府收入就低了,但是一味提高税率会降低整体社会的经济活力,因为你不管多辛苦赚钱,你赚来的钱都进了政府口袋,所以你要么忍受这种不公平要么设法避税。客观结果就是,最后政府的税收一样很低。画成一条曲线就是一个先递增然后下降的曲线。这条曲线在经济学上叫「拉芙曲线」(Laffercurve)。对于从小被辩证法熏陶的人来说,这种辩证关系应该是很好理解的。现实中最大的麻烦是弄清楚我们在曲线的哪个斜坡上,因为那会影响政府未来会提高还是降低税率。

好,现在我们来谈全书的第二个概念「显著性检验」。

这一段,让我们先从一个年的搞笑诺贝尔奖开始,这个奖项颁给了3个统计学家和一个记者,他们宣称从《圣经》中发现了隐藏的秘密,他们宣传「希伯来文的圣经」包含了以色列32个拉比的出生日期,以及总理拉宾被刺杀的时间。这里的拉比你理解成某种宗教领袖就好。是不是感觉特别魔幻?

那么,他们是怎么发现的呢?首先,他们把「希伯来文的圣经」抹去任何间隔,包括空格和标点符号,得到一串几十万字的纯粹的希伯来字母串。然后他们设定「算法」,形成小字符串,然后设定一些规则,形成有意义的单词。通过复杂的算法,这几个人宣称《圣经》中蕴藏了很多未来的信息。

这个结果,发表在非常权威的期刊《统计科学》上,让学术界炸锅了,大家觉得这个正经期刊怎么能刊登这些乱七八糟的东西呢?最后这个期刊发了声明,说之所以发表这篇文章不是肯定它的结论,而是让大家知道凑出如此不可思议的巧合只需要猜谜语一样的工作就可以。

一个美国记者靠着这个结果写了本书叫《圣经密码》,搞笑的是这书还成了畅销书。这件事其实很简单,因为用30万个字符串和特殊算法算出这些东西其实不难。这告诉我们「小概率事件并不少见」。有一位叫马凯的人用类似的方法在《战争与和平》中也提取出了拉比的出生日期和总理拉宾的被刺杀日期。他还从《白鲸记》中提取出了约翰·肯尼迪、甘地、列夫·托尔斯泰等人遇刺的信息。

这里,我们再举一个有趣的例子。9年,在旧金山人脑成像会议上一个专家做了个报告——《大西洋死鲑鱼对人类神经活动的观察——论多重比较修正的重要性」。在研究过程中,作者把一张照片放在死鱼前,然后通过核磁共振装置发现这条死鱼能够读出照片中人物的情绪。这条鱼为什么有如此的能力呢?这当然是一个冷笑话了,它实际上是在批评:某些神经成像技术研究人员不够严谨,忽略了「小概率事件并不少见」。神经科学家会把核磁共振图像分解成成千上万个细小的体素,每个体素对应大脑的一个区域。扫描大脑的时候,即使是死鱼的脑也会有随机噪音。因为神经系统非常庞大,可以提供的体素很多,这些体素可能会有几个刚好和照片吻合而已。这篇文章发现,其实大量研究没有考虑「小概率事件」的普遍存在性。科研人员可以通过各种修正方法让自己的成果看起来很可信。

具体的修正方法这里不提,我们通过一个经典的骗术来说明背后的原理。假设你某一天收到一个股票经纪人的邮件,它预言第二周某支股票会涨,然后预言应验了,紧接着你收到了同一个人发来的邮件说这支股票下一周会跌。一周之后,它又应验了,你同时收到了下一个预言。一直到第10个星期,他的预言都是准确的。这个概率多低啊,每次有50%猜中的概率,那么对你来说这件事的概率也只有分之一。但是,对于发邮件的人来说,准确的概率是%。为什么?因为他同时给个人发邮件,然后在第一次的邮件中告诉个人某支股票会涨,告诉剩下的人这支股票会跌。第二周的时候看哪一波和现实符合,再给这波人的一半人预测会涨,一半预测会跌,以此类推。总有那么一个人,在这个人眼里,发邮件的人简直是神预测。「圣经密码」的操作本质上也是这么回事,它的算法过于「复杂」,可以调整的地方很多,加上本来字符串又长,最后的结果是只要调整好算法,就能得到想要的结果。

不只是科学研究,在现实的生活中会发生各种奇怪的现象,那么我们怎么判断哪些是确实有趣的,哪些完全不需要大惊小怪呢?如果让一个数学家去解决这个问题,他会怎么去解决呢?科研中很多问题简化为发生或者不发生两种情况。比如某种药是有效或者无效。这种无效的情况属于「零假设」,如何推翻「零假设」呢?我们依靠的方法就是「显著性差异」。

有人觉得这不难啊,我们找个人,一半吃药,另一半吃安慰剂。然后只要吃药的人1年后的死亡率低于吃安慰剂的人,我们就能知道这个药有效了。这个方法的错误在于:即使药压根无效,也有相当的概率,比如40%,吃药的人存活率高于吃安慰剂的人。真正的检验方法应该考虑极端情况。比如,通过计算我们发现,如果不吃药,50个病人1年后存活的概率低于分之一。但是服药后50个病人确实在一年后活了下来,这个时候你说药物靠谱的说服力就高了,药物无效这个零假设将被推翻。

概括起来,第一步,我们开始试验;第二步,我们假定零假设为真,而p为观察结果中出现极端情况的概率;第三步,如果p的概率很小,但是我们确实观察到这个现象出现了,那么我们认为零假设被推翻,它不是真的。否则零假设依然成立。

那么p多小才算小呢?这么说吧,只有那些成立的概率高于99.%的结论我们才相信。真正了解科学的人才知道科学有多严格。

本书的第三个重点是「期望」。

有人说,买彩票就是缴智商税,但是曾经有一群麻省理工学院的学生,他们组织起来集体购买彩票。从年开始,这群学生组成了「随机策略」小组,系统性地大量购买一种彩票,最后还获得了百万的收益。这背后的原理其实就是「数学期望」的简单应用。

彩票是怎么来的呢?最早在热那亚,人们要从个议员中选举出两个总督,他们靠的不是选票,而是直接抓阄。于是这个城市的赌徒就拿这个来赌博,不同的是他们直接用数字代表议员。赌徒努力选取5个数字,猜中的越多,奖金越高。

亚当·斯密在《国富论》里面批评说:卖彩票都能赚钱说明人们高估了自己中奖的概率,从数学上讲买得越多,遭受损失的可能性越大,买进所有彩票%亏钱。

那么亚当·斯密的说法对吗?亚当·斯密当然是一代大师,但是我们也不能盲目相信他的每句话。他犯的错误就是我们一开始提及的「线性思维」,事实上,如果你购买两张彩票,相比一张彩票,你的中奖概率是提高的,你买的彩票越多,你中奖的概率当然是越高的。问题是,你买得越多,你花的钱也越多。所以你必须同时考虑两种因素:获奖的概率和获奖的金额。数学上简单易行的方式就是数学期望,也就是一个加权平均数。假设我们总共有0万张彩票,只有一张能获奖,奖金是万美元。那么每张彩票的「数学期望」是0.6美元。一个理性的选择是,如果购买彩票的价格低于其数学期望,你就应该选择购买;如果别人以高于数学期望的价格问你买彩票,你就应该卖给他。比如有人愿意拿1.2美元买你的彩票,你就该卖给他。当然了,是在开奖前。事实上,彩票的贩卖者压根不会以低于0.6美元的价格贩卖这个彩票。

如果彩票规则设置有问题会造成卖票的人亏死。你觉得,会有卖彩票的人傻到不算算就卖票吗?

答案是:还真的有过。

在年秋季的时候,美国一家彩票中心的人发现原来的彩票卖不出去,于是发布了一种新规则,这个规则规定,如果一周内没有人赢走奖金,奖金不会累计,只要奖金高于万美元,奖金就会向下分配,增加不那么容易获奖的奖项的金额。根据这个新规则,麻省理工学院的一群学生发现,在一定条件下,彩票的期望会大于其价格,导致在数学上购买它变成了非常合理的事情。当然了,即使这个时候,数学期望值也不是说你买一张赚一张,而是当你大量购买的时候,你的每张彩票价值才能真的趋于期望。于是,以詹姆斯·哈维为首的学生一次性购买了0张彩票,获奖0美元,大约是其投资金额的3倍。哈维自然不可能就此收手,他们组成了「随机策略」小组,草拟了通过这个彩票赚钱的计划。有意思的是,除了他们还有美国东北大学以张姓博士为首的人也在用这个彩票赚钱。这群人更厉害,每次出手都购买30万美元的彩票,获得了高额的利润。在七年的时间里,哈维的团队通过这个彩票获利万美元。

当然了,这种有漏洞的彩票其实并不多,即使存在漏洞,你也必须一次性大量买进才能真的获利,那么为什么有那么多人还是会去购买彩票呢?这个问题让懂数学的经济学家很费解,他们希望解释为什么博彩行业那么发达。经济学家弗里德曼和萨维奇给了一个解释。在他们的解释中,计算彩票的收益不再只是考虑客观上的金钱,而是「效用」。同样的美元,对于不同的人来说效用是不一样的。对于某些人,这是足以让人心动的一个数目,对于另一些人,他们可能只是随便玩玩。对于一个中低阶层的人来说,每周花5美元买彩票不是什么大钱,损失几乎为0,但是一旦中奖,会直接进入一个新的阶层。按照这种效用来计算,你会发现一张彩票的数学期望就会很高。更别提,无论输赢,买彩票都能给一部分人带来生活的乐趣。考虑到这些,彩票业的发达就不是多奇怪的事情了。很多退休老大爷,每天拿着本子计算哪个号码最好也是他们晚年的一大享受。

本书的第四重点是「回归效应」和「相关性」。

你是否有喜欢的歌手,你发现他的第一张专辑特别有才华,但是第二张、第三张就突然平平了。或者你发现某些作家在第一部小说大获成功之后,第二部作品的受欢迎程度明显下降了。他们真的是所谓「江郎才尽」吗?如果你问「优生学之父」高尔顿这两个问题,他会告诉你,这种现象叫「回归平均值」。

高尔顿是一个对遗传有浓厚兴趣的人。他曾经致力于研究遗传和身高的关系。包括他在内,大部分人都知道父母个子高的话,孩子个子往往也高。如果一名一米八的大汉和一米五五的小个子女孩儿生孩子的话,他们的孩子的身高很可能超过他们的平均值。但是他发现了一个异常现象:当父母的身高都矮的时候,情况相反,他们孩子的身高虽然也比较矮,但是不会比他们的父母矮。他认为,从整体上看,成年子女的身高和他们父母相比更加趋于平均水平。这个现象叫「回归平均值」。他同时考察了智力和遗传的关系。伟大的科学家和作曲家的孩子往往也有相当的突出表现,但是很少有超越其父母的。优秀的品质很难持续,随着时间的平移,平庸就会到来。高尔顿认为,智力、成功和身高这些东西往往是由内部和外部因素共同决定的,外部因素包括成长环境和纯粹的运气。这些因素往往是偶然的、波动的,不会总是有利于某人,导致的结果就是「回归平均值」,成为一种常态。比如,歌手和作家的成功自然是因为有才华,但是也有很多偶然的因素,当这些偶然因素有利于他们的时候,你能看到灿烂的成果,但是当这些偶然不眷顾他们的时候,他们的表现就不那么突出了,这不是什么「江郎才尽」,这是生活的一个必然罢了。残酷的是,只有那些「超常发挥」的人才能真的成功并且被给予更多的机会和资源。数学家霍特灵指出:只要研究的变量同时受到稳定因素和随机性的影响,那么平庸状态的胜利或多或少是一种必然。

高尔顿的研究虽然指出了只要研究对象受到随机性的影响,就容易发现回归平均值的现象,但是他没有指出随机力有多大。要明白这个,数学家发明了一个概念:「相关性」。这是一种刻画两个变量相互影响程度的量。相关性越高,两者会越发表现得像「线性关系」,反之则相关程度越差。定量的好处在于我们利用这个数学概念把语言上的「无关、有关系、相当有关系」变成了某种定量的数字。利用相关性,我们能很好地简化记录信息的方式。如果A和B高度相关,我们其实只要记录A就可以了,B可以被简单地推导出来。这个原理也是数字压缩技术的一个核心想法。比如我们记录一张数码照片,完整地记录每个像素的信息需要百万个数字串,比如万,但是这些数字串有时候往往具有很大的相关性。比如,一个像素是绿色的,那么下一个很可能也是绿色的,实际上你就能用远远少于万个数字串来表达完整信息。这套技术的数学原理后来得到了飞速发展,现在已经是热门的研究领域,叫「压缩感知技术」,天才数学家陶哲轩就是其中的翘楚。

好了,这本书的主要内容介绍得差不多了,我们回头用所学的知识解释一下开头的瓦尔德改进飞机的思路。为什么军方认为应该给中弹多的部分加防护呢?因为他们认为返航飞机就是所有飞机的一个随机样本,这些返航飞机就能代表所有飞机的中弹情况。瓦尔德作为数学家敏锐地质疑了这个基本假设,因为不能认为飞机不管什么部位中弹,幸存率都是一样高。他认为飞机的幸存率和弹孔的位置具有高度相关性。在这个问题中,虽然击中不同部位的概率是差不多的,但是击中后飞机坠毁的可能性不同,如果引擎被击中,飞机一定坠毁,那么返航的飞机中你压根不可能找到引擎上有弹孔的飞机,因为它们已经沉在海底了。这其实就是经典的「幸运者偏差」效应。所以瓦尔德建议加护那些没有中弹的部位。

在本书中我们还了解了其他四个数学概念:

我们先学习了「线性思维」的误导性;然后通过「显著性差异」,我们知道有些看似神奇的结论其实平平无奇,只是单纯的巧合,而「小概率事件并不少见」;接着,我们知道了在面对概率和获利的时候我们应该考虑的是期望,在获利这点上,我们得考虑它的效用而不是单纯的金钱;最后,我们明白了对于由多种随机因素决定的现象,它们很可能会归于平均值。

那么在这个时代,这些数学知识还有什么启示呢?这里我谈一点个人的见解:我们生活在信息和媒体高度发达的年代,所以我们压根儿不需要担心信息不足,我们需要担心的是自己是否被媒体信息误导了。

媒体人有时候会有意无意地使用简单的「线性类比」制造耸动的标题和内容,但是我们知道这种类比不是总能成立的,往往最多只是修辞手法罢了,不能当真。媒体总是

转载请注明:http://www.abuoumao.com/hyls/1384.html

  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介| 发布优势| 服务条款| 隐私保护| 广告合作| 网站地图| 版权申明

    当前时间: 冀ICP备19029570号-7