在上周我带领的摩西五经导论学习中,遇到一个问题,使我再次意识到数学思维的重要。这个问题是什么稍后再说。
七艺中的后四艺算术、几何、天文、音乐,都是数学性技艺。真正的古典教育人才,理当有全备、严谨的数学思维。在现今的大数据和AI世代,数学领域中的“概率与统计”的重要性更加突出。
几年前我和一位弟兄打台球,约定九局五胜,输家付100元的台费。然而当我4:3领先时,我们都有事必须离开,就提前结束了。事后,我们两个理工男就探讨了一下,刚才的局面,最“合理”的付费方式是什么?一人付一半当然没问题,但是我既然领先,似乎应该是我获胜几率较大。
简单讨论后,我们得出结论:假设我俩水平相当,就是说胜率一半一半,那么他赢的可能只有一种,就是连赢两局,5:4逆袭我。而我有两个赛点,输一局也无妨。就是说,他赢的方式只有一种,就是以50%的概率连赢两局,这个概率是0.5*0.5=0.25。换言之,我最后获胜的概率应该是1-0.25=75%,他是25%。因此台费应该他付75,我付25。
实际上后来我看数学史的时候才知道,帕斯卡就是被一个完全相同的问题触动,创立的概率论。
不过后来我又想,我们的算法里有一个小小的漏洞,就是“假设我俩的胜率各是50%”。这个假设的依据是什么?过往战绩?那个不记得,但大致的确是水平相当。但若考虑那天临场的状态,我既然已经4:3领先,是否应该更合理地假设,我的胜率应该高一些,是4/7,约等于57%?如果是这样,那么他获胜的概率就应该是0.43*0.43≈18.5%,所以最后的结果应该是:我付18.5元,他付81.5元。
这个后续的思考,就涉及了一个所谓“先验概率”的问题。这就是赫赫有名的贝叶斯定理的一个关键要素。贝叶斯定理在现今的人工智能等领域无处不在,神经网络、遗传算法等都与贝叶斯定理有关。
值得一提的是,托马斯·贝叶斯是18世纪英国的一位长老会ms,毕业于爱丁堡大学。
这个定理的定义很简单,维基百科如此描述:
这里的先验概率,应该来自统计。但如果没有足够数据,就只能凭信心,或者基于信念的特定假设。
举个例子。
如果80%的犹太人是鹰钩鼻(这个肯定不准确,就算刻板印象吧),而某人就是鹰钩鼻,那么请问,这个某人是犹太人的概率有多大?
无论你的直觉是什么,这个问题都可以用贝叶斯定理算一下。
首先收集一些数据:
1:犹太人占人类的比例
2:鹰钩鼻占人类的比例
现在可以套公式了:
所以,这个鹰钩鼻的某人是犹太人的概率只有1.8%。
回到一开始的问题。学习中引起我思考的是这句话:
他的逻辑似乎是:亚楚哈西斯史诗是三段结构(创造,堕落,更新,V字结构),创世记是三段结构(V字结构),所以摩西是刻意效仿亚楚哈西斯史诗写的创世记。
首先,仅从逻辑学上这个就不成立,更谈不上有力。因为这就像那个经典的笑话三段论:
猴子屁股是红的
苹果是红的
猴子屁股就是苹果
这个错误屡见不鲜。比如就有人用这个逻辑论证:
胖牧是搞政治的
假ms是搞政治的
胖牧是假ms
先不说这些大小前提正确与否,仅就推理形式来说,这就是彻头彻尾的错误,是无效三段论。这是定性分析。
下面试着用贝叶斯定理算一算,摩西抄袭亚楚哈西斯的概率是多大。
先要确定几个概率。
古代中东创世历史类文学作品占全部文学作品的比例。这个定义极其狭窄,因为而且绝大多数的文学作品都是传记,爱情,冒险、记录……所以这个比例不会太高,假设是0.2%。
V字结构的作品占全部文学作品的比例。这个没法统计,但常识告诉我们,大多数小说、剧本、历史都是这个结构,因为不可能平铺直叙,总得有起承转合,讲述盛衰兴亡。但我们先假设,这个比例仅有9%。这个是严重低估了的。
古代中东创世历史类文学作品里有V字结构的作品的比例。根据现有统计,这个高的惊人,假设是80%。
问:某个有V字结构的作品(创世记)是抄袭(刻意效仿)古代中东创世历史类文学作品的概率是多大?
现在可以套公式了。其实你已经能看出,这几个数字,我是刻意和前边鹰钩鼻那个例子划了等号的,P(古)= 0.2%,P(V)= 9%,P(V|古)= 80%。
所以,P(古|V)= 1.8%。再考虑到P(V)的9%这个比例实际上是严重低估的,假如调高到70%,那么P(古|V)仅仅等于0.21%。
就是说,摩西抄袭亚楚哈西斯的概率,根据我的计算,是在0.21%到1.8%之间。有大约99%的概率,他没有抄袭。
翻译成大白话就是:第一,摩西写创世记是直接领受的,他不需要抄谁;第二,写历史本就要有V字型的起承转合,这是个普遍启示,不需要谁抄谁。
愿更多有志于古典教育的人士,更重视数学性的后四艺,更重视逻辑(它本身也在前三艺里),不然很容易误导自己,误导他人,哪怕是在一些看起来纯粹的文字、文学问题上。具体来说,就是一定要学好逻辑学,学好几何原本、音乐、天文、初等代数,更要好好学一学概率与统计。