查看原文
其他

贝叶斯思维——投资的最大基石

徐倬迅 徐倬迅的投资日记 2022-06-29
今天给大家讲述一个我们经常提到的思维方式——贝叶斯思维。根据我的观察,大部分人对于贝叶斯思维的认知往往都处于只鳞片羽的状态,主要是基于数学公式上的认知,但不能融会贯通。但事实上,贝叶斯思维非常的好用,可以被用在生活中的各个方面,是投资的最大基石,也是人类前进的不竭动力。

引子

        

  • 首先给大家做一道题目,请大家务必参加投票。因为这个投票可以帮助你认知自己

  • 你面前有一个盒子,你听说盒子里面装着99个白球和1个黑球。一分钟之前你已经拿过了一次,拿出了一个黑球。现在再让你拿一次,猜猜这次拿出的是白球还是黑球?


  • 这道题在望岳内部也测试过,我们先保留悬念,等到文章的后半段再给大家揭晓答案。因为要完全解释这道题还需要很多零零散散的信息。

        

贝叶斯何许人也

        贝叶斯全名托马斯·贝叶斯 (Thomas Bayes),是著名的英国神学家、数学家、数理统计学家和哲学家。贝叶斯在数理统计上的主要贡献其实是贝叶斯公式,也就是我们这篇要讲的主要内容。

        1763年,贝叶斯逝世的两年后,其好友Richard Price整理了贝叶斯的生前手稿,发表了《An Essay towards solving a Problem in the Doctrine of Chances》一文,并提出了贝叶斯公式。这篇文章一开始被发布在哲学期刊上,后续才被发布在数学和生物学期刊上。

         跟大家预想的不一样,贝叶斯是神甫出身,只是业余的数学家。他的一生其实都在试图证明“上帝是否存在”这个神学终极问题。我尝试复盘一下他的文献中的思路。

        首先,贝叶斯在想如何证明上帝存在呢?

        贝叶斯寻思着,要么得见过上帝,要么得见过神迹。见上帝得去天堂,去的都是死人的了,这肯定不靠谱,这个不能证明也不能证伪。所以只能通过神迹来判断上帝是否存在。比如耶稣复活就是神迹的体现,大家都知道人死是不可能复活的,但如果出现了耶稣复活的事件,就说明耶稣背后存在超越常识的神秘力量,上帝存在的概率就变得非常之高了。但耶稣复活这个事情又只是记载在典籍里面,他也没有见过,所以还是没法证明。

        贝叶斯又想了一个法子,因为教义中一直讲上帝引导人们向善,也可以通过坏人是否遭受到报应来判断。如果全部坏人都遭受到了报应,那么上帝肯定是给坏人足够的惩罚,上帝存在的概率也十分之高。但如果坏人都活的好好的,还长命百岁,那要么是上帝无所谓人们是否向善,因为上帝没有对人的善恶进行神秘力量的干预;要么是上帝不存在,因为没有任何迹象表明上帝进行了干预。

        终其一生,贝叶斯也没有找到上帝存在的证据,甚至提出了一些否定上帝存在的想法。在世时,贝叶斯很巧妙的用神学所能接受的思想把他的思考表述了出来。直到贝叶斯去世后,从其手稿中可以看出他从神甫到一个实事求是的科学家的思想转变。

        时至今日,或许大家已经无法理解这份思考其中的含金量。贝叶斯其实提供了一个跳出原生环境、独立思考、尝试找到真相的绝妙思维方式!作为神甫却有意识去否定神本身,这份思维值得敬佩也值得学习。

贝叶斯公式

               时至今日,贝叶斯思维已经被整理成贝叶斯公式被应用在各大领域,其公式表述如下:

            公式中,事件A的概率为P(A),事件B的概率为P(B),事件A已发生条件下发生事件B的概率为P(B│A),事件B发生条件下事件A的概率为P(A│B)。

            大家如果仔细看公式会明白贝叶斯的核心原理:根据已经发生的事情不断更新概率模型,修正认知。

            按照贝叶斯最初的思考来举例,耶稣复活作为事件B,上帝存在作为事件A。因为耶稣是上帝的儿子,上帝如果存在肯定会复活自己的儿子,也就是P(B|A)的概率其实是几乎等于100%的。正常人是几乎没有复活的可能性的,所以耶稣复活的其他可能性非常的小,如果耶稣复活大概率是因为上帝复活的,P(A|B)的概率也非常的大。所以根据贝叶斯公式,如果耶稣复活,那么P(B)=1,那么上帝存在的P(A)=P(B)*P(A|B)/P(B|A)=1。

            后来人们给P(A)取了个名字,叫做先验概率,反应人们对事件的认知;P(A|B)叫做后验概率,反应人们通过B事件对A事件的修正。人们通过加入新的关联信息B,不断的更新先验概率P(A),因为通过信息B,可以使得我们对事件A的预测更加准确。

            直到这里听起来还是有点玄乎,我接下来用我个人的理解讲述一下我的理解。

    我理解的贝叶斯

               已知的认知是先验信息,通过先验信息推导的是先验概率。

            获得数据、求证事实,并把这些信息加入到先验信息中去,更新完后的结果就是后验信息,通过后验信息推导的就是后验概率。

            不断获得更多的数据、求证更多的事实,将这些后验的结果最为下一次的先验,不断修正思维,这个过程就是贝叶斯。

            比如我们经常听到一句话,“当房间里面出现了一只蟑螂时,其实整个房间内都是蟑螂”。这句话其实就暗含贝叶斯思维。

    • 先验认知:蟑螂平时是会缩在角落,很少出来。一般一只雌蟑螂能孵化出10-90个卵鞘,一只卵鞘正常能孵化出10-50只小蟑螂,并且五个月能繁殖一代。如果家里看到了一只小蟑螂,其实跟它同期出生的兄弟姐妹已经有上百只了。

    • 后验更新:房间里面出现蟑螂的概率是很低的,但一旦出现了一只蟑螂,大概率整个房间都是蟑螂。

            再进一步讲,比如2020年4月时,纽约安排了一次3000人的新冠抽样抗体检测。

    • 先验认知:当时官方通报的实际确诊率是3%,3%的纽约人得过新冠。

    • 后验更新:抽样检测发现阳性率是13.9%。这个值和之前官方通报的3%差距甚远。如果抽样是相对合理的,那么我们可以直接认为13.9%的纽约人在2020年4月时已经有了新冠抗体。因为这个时间点实在是太早,冰冻三尺非一日之寒,时隔一年多很多躺平的国家也没有达到13.9%的感染率,所以外交部完全有理由产生对病毒起源的质疑。

    极大似然估计

            极大似然估计是基于贝叶斯的应用环节,是优化使用的有效信息。极大似然其实就是最相似的意思,极大似然估计就是“与结果最相似的估计”。其核心原理就是,虽然我不知道事件A到底是什么情况,但是根据我目前的样本结果,只有真实的概率是这样我才能得到我目前的结果。所以我100%的相信我看到的样本结果,通过他来倒推真实概率。

            在100次抛硬币的实验中,我们得到了55次正面和45次反面,我们需要对抛硬币是正面的概率进行估计。

            由于我啥也不知道,只能靠猜的方式估计,猜测正面的概率是10%,那么得到55次正面和45次反面的概率是0.1^55*0.9^45=8.73*10^-58,这个概率实在是太低了,所以被放弃了。

            然后我继续猜,猜测正面概率是50%,那么得到55次正面和45次反面的概率是0.5^55*0.5^45=7.89*10^-31,可能性比上一种概率大了不少。

            最后我发现,如果猜测正面概率是55%,那么得到55次正面和45次反面的概率是0.55^55*0.45^45=1.3*10^-31,可能性最大。

            所以,根据极大似然估计,这枚硬币正面的概率是55%。

            听起来方式有点奇怪也有点复杂,但仔细看发现,这个概率函数可以用正面的概率p来表示,表示为p^55*(1-p)^45,这个函数是单调函数,是可以求导的算极值的。通过取对数的方式可以简化运算,最终我们得到极大似然估计的数学表述(该表述来自教科书):

            结合贝叶斯最早的案例来看。

            耶稣复活发生的概率那么小(先验概率决定)。

            但是万一他真的复活了,那么说明“上帝存在”的概率十分之高(后验更新)。

            概率高到什么程度,概率最高到什么程度,这个更新的过程其实是应用了极大似然估计。只有在“上帝存在时”,耶稣复活的概率才被显著提升了。

    解答开头的问题

            

            你面前有一个盒子,你听说盒子里面装着99个白球和1个黑球。一分钟之前你已经拿过了一次,拿出了一个黑球。现在再让你拿一次,猜猜这次拿出的是白球还是黑球?结果你又拿出一个黑球,请问下一次拿出的是白球还是黑球?

            其实,正确答案是选黑球。

            到这里可能会有很多人产生了疑惑,为什么不是选择白球呢。如果有99个白球和1个黑球的话,你可能只是运气实在是太差了,不小心抽到了唯一那个黑球。但他们忽略了,这种小概率事件一旦发生,就意味着你之前的信息源是有问题的,此时应该默认已知信息源是完全错误的,需要根据你自己的信息源替换掉这个先验概率。

            “盒子里面装着99个白球和1个黑球”这条信息是你无法求证的二手信息,是干扰你思维的万恶之源,甚至是接近于上帝存在这样的被无数教义驯化和洗礼的接近已知“真理”的存在。大多数人会选择相信这个信息,但目前根据你的已知信息,你已经从这个盒子中抓出来了一个黑球,从这个盒子里面抓出来黑球的概率是100%。根据极大似然估计,你应该选择相信这个盒子中全部都是黑球,因为只有盒子中全部都是黑球,你一抓就抓出来一个黑球的可能性是最大的。

            到第二问时你应该更加坚定,相当于你已经连续两次抓出来依旧是黑球时,你对于“这个盒子里面全是黑球”的把握更大了。根据贝叶斯思维,应该继续选择黑球

    跳出思维限制

            其实这个题目有问身边的人,大部分人会在第一问选择拿白球,第二问中大部分人会不知道这次的投票结果是怎么样的,其实这个题目本身也并不重要,生活中比这个问题复杂千万倍的问题也依然存在,这个问题最重要的是跳出原先的思维限制。也就是:

            你是否有勇气否定过去的“真理”?

            回头看一些过往的科学研究,其实每一次科学的向前迈步都是基于否定“真理”的。比如人们发现牛顿力学和经典运动学只是物体运动速度较低时一种表现,本质是速度构成的影响几乎可以忽略。人们首先发现高速运动的电子测得的质量比之前预计的高很多,不符合认知,接着发现高速电子运动在速度接近光速时,出现了“时间减慢”、“质量增加”等一系列奇奇怪怪的性质。直到爱因斯坦提出相对论,通过否定绝对时空观才重新梳理了运动学体系。

            否定“真理”,是人类前进的最大动力。

            这个否定是基于贝叶斯的、也是基于极大似然估计的。试想一下,当时物理学已经囊括了几乎全部的认知,只是存在“以太破灭”和“紫外灾难”两朵乌云,并且这两朵乌云只是一点点无法解释的小现象。难道这不是在“有人说装着99个白球和1个黑球”的盒子中摸出来了一个黑球吗?最终人们从这两朵乌云中推导出了相对论和量子力学,可以并应用于核能和量子计算,这难道不是人类前进的基石吗?

            其实我看到很多人,他们习惯性的用一个已知观点来回答另一个新生现象,也就是南老师经常说的“用旧地图看新世界”,人们只愿意相信他们愿意相信的东西。即使出现了一个违反他们旧的思维认知的事物,他们也不愿意修正自己的思维方式 ,这些人可能永远都看不到新世界了。

            如果是贝叶斯思维的人,当出现了那个违反常识的事件就应该修正自己的认知模型。这听起来很简单,但其实非常的难,我很少见到有人能不断修正自己的认知模型。大部分人的思维方式会僵化,会入别人的思维逻辑中,会最终失去了独立思考的能力,最终变成“人类的本质是复读机”。

            警惕那些告诉你“盒子里面装着99个白球和1个黑球”的人,他们有时候也是无心的,他们只是在陈述一些道听途说的信息或者背诵某些“真理”。因为人体大脑的结构注定存在一定的记忆性和惯性,他们只是陷入了旧的神经元结构中很难出来了,对于这些信息源来的信息需要打一个大大的问号,甚至对于部分信息源需要“取反集”。

    决策中的贝叶斯

            事实上,我们遇到的决策比开头那个选黑球还是选黑球的问题要复杂的多。比如现在你有一个朋友,人品非常好、非常靠谱、但是喜欢人云亦云,你应该给多少可信度加权;比如现在有一个研究员,专业水平不错但是喜欢轻微吹吹牛逼,你应该给多少可信度加权;比如现在有一个专注某一个领域的学识渊博的学者,面对他似乎不懂的领域应该给多少可信度加权;比如现在市场上有某个宏观经济学家,之前预测胜多败少,应该给多少的可信度加权。而这个时候,这些人合起来都给你讲了对一个事情的不同观点后,你到底应该选择相信谁的哪些部分呢?

            我这里尝试复盘一下当时大伙决定买某公司的逻辑,按照贝叶斯思维进行梳理:

    • 第一步,找寻有没有明显违背直觉和经验的“异类”,如果“异类”出现,说明旧认知是错误的,需要调整贝叶斯模型。

      • “异类”主要是指出现了违背旧认知的小概率事件。

      • 胡博士一帮清华高材生特别看好某电车。清华毕业大概率不会被人轻易洗脑,车子质量应该确实没问题,可信度加权其实非常高。要么是该厂的品牌做得好,要么是该厂的质量做得很好。

    • 第二步,找和最终想要达成的结果相联系的事物。进一步判断条件概率。

      • 在A条件的已经达成的前提下,B事件发生的概率是会被放大的。

      • 该厂在月销量越过4000辆的时间节点上,毛利率转正,能活下去的概率被放大了。

      • 国家给予换电模式额外的补贴,本来30万以上的电动车是不享受补贴的,但对换电模式开了一个口子。说明国家对换电模式的支持力度是很大的,该厂活下去的概率也被放大了。

    • 第三步,调整到极致贝叶斯的认知,在此认知上进行极大似然估计。

      • 依据当前样本判断的未来最有可能发生的事情,就是极大似然估计。

      • 依据目前的全部样本,进行极大似然估计,该厂会成为未来中国汽车最高端的品牌之一,市值自然不在话下。        

      实事求是

              其实大家都忽略了最重要的一点,改革开放四十多年以来教会我们最重要的事情就是“实事求是”,这难道不是最大的、最极致的贝叶斯思维吗?

              根据贝叶斯模型不断调整自身的决策,这难道不是“实事求是”吗?这难道不是百年党史教会我们最重要的东西吗?这难道不是新中国成立以来的必经之路吗?

              或许人类依旧活在一个赛博朋克的世界里面,或许“人类一思考,上帝就发笑”,或许我们只能抓住一小部分真相而很难看清全部。

              但我们清楚的知道,我们依旧还沿着贝叶斯思维不断向前,不断修正自身的思维方式,不断创造更多的历史。这是人类目前做到最大的组织的成功路径,也是贝叶斯思维下最有可能成功的模式。

              实事求是,就是最大的贝叶斯!

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存