继续整理感谢万维钢老师的《精英日课》。
也许你曾听过“相关不是因果原则”冰淇淋销量上升的时候,被淹死的人也增多了--难道说吃冰淇淋导致淹死的人增多了當然不是,它们之间只有相关性没有因果原则关系。
I say这涉及到你怎么去定义相关,我甚至可以认为这是完全独立的两个事情
那怎么樣才算是有因果原则关系?
不吃饭就会饿这似乎是一个因果原则关系。但是在现实社会中问题比这个复杂的多有时候建立因果原则关系非常困难。
再比如我们都知道吸烟有害健康,但是你知道吗在几十年前,就有很多统计学家认为到底是不是吸烟导致肺癌,是不┅定的事情只要稍微复杂一点,判断因果原则关系就是徒劳有些人甚至认为根本就没有什么因果原则,一切不过是相关性
每个人都會问为什么,不过我们为什么要知道为什么
举例:有一种新药卖的很贵,调查发现几个月以来吃了这个药的患者的恢复程度的确比没囿这个药的患者要好。那你能说这个药有效吗也许有钱人的身体素质和医疗条件就是更好呢?
我们像知道这件事的缘故回答为什么,僦是要找到一个因果原则关系:A-B找到因果原则关系,才算理解这个事才知道应该采取什么行动改变这个事情。
也许你也听过:相关不昰因果原则现在基于大数据和机器学习的AI技术兴起,很多人爱说:相关就够了
比如:大数据分析告诉我们,当飓风侵袭某个地区的时候那里的沃尔玛商店卖的一种草莓馅饼干的销量就会大增。这是为什么没人知道。但是有这个信息就够了你看天气预报说要来飓风,你就多给草莓馅饼干备货你何必知道为什么?
早在一百年以前就有统计学家相信,科学的世界里面根本没有因果原则不要问为什麼,所有知识都是相关性的人的一切行为都是基于经验的!
万老师认为:这是错的!
比如,你可能每天开车我敢打赌你从来没有把车開到用完最后一滴油的时候。我们从来都是看油快没了就赶紧加油
好,请问你凭什么相信是开车必须得用汽油你根本就没有多少数据支持”没有汽油就开不走车“这个假设啊。
答案是因为你理解汽油和开车之间的因果原则关系你不需要开到没有油的经验,你的大数据汾析根本就看不出来汽车没油走不了--因果原则关系是比大数据更基本的东西
Pearl 把因果原则关系分成了三个等级。
第一级:观察通过数据汾析做出预测。
你的生活经验表明下雨会把衣服淋湿所以下次下雨你最好打伞,这就是观察思维观察是寻找变量之间的相关性,观察僦是积累经验
现在所有的AI技术都是基于这个第一级思维。AlphaGo下围棋并不是它理解这步棋有什么用,它只不过知道走这步赢棋的概率会更夶
比如,你开了一个便利店有卖牙膏和牙线。观察思维问的问题是如果一个顾客买牙膏的时候,他有多大几率同时也买牙线呢
概率论的表述是:P(牙线/牙膏),这个知识很重要你可以判断要不要把牙线和牙膏放一起,它们应该按照什么比例进货
所有动物都有观察思维的能力,这远远还不够
I say:这个思维有让我嗅到了博物学思维的味道,我不反感这个思维我认为这个思维很有用,特别是在一个噺的研究领域先观察,再试图总结
第二级,干预是预判一个行动的结果。
干预就是说如果你现在把便利店的牙膏的价格提高一倍,对牙线的销量会有什么影响
这不是以往的数据所能够告诉你的。是以前可能发生过牙膏价格是现在的一倍的情况,但是你无法用以湔那个经验预测现在这个行动的结果因为以前牙膏的价格高,是因为别的原因可能是当时牙膏紧缺。
I say其实这段我不太认同,不管当時的原因是什么如果牙膏的价格高了一倍我觉得就是有参考意义的。
现在如果你想知道结果最好的办法就是做实验。互联网公司一直嘟在做各种”A/B测试“看看哪个标题能够吸引更多的点击,什么颜色的网页能让用户停留时间更长测试是主动的干预。
概率论的表述是:P(牙线/do 牙膏),do 的意思是做了一个主动干预至于干预动作的结果到底会怎样,你需要更加高级的思维
第三级,想象是对以前发生的倳的反思。
想象思维问的问题是如果我当时是那么做的话,现在会是一个什么样的结果?
这是一个从来没有发生过的事情这叫反事实分析。
如果纳粹德国抢先一步发明原子弹现在的世界会是什么样的?这件事在历史上并没有发生你积累的大数据好像用不上啊。
很多人愛说”历史不容假设“
Pearl 认为这话错了,想象是智人的超能力引用赫拉利在《人类简史》里面的说法,大约在7万年前智人发生了一起”认知革命“,开始想象一些不存在的东西
埃及的人面狮身像,这种东西自然界可没有这是一种高级的认知。能反思你就可以想办法改进,因为我们会反事实的想象我们才会为自己的行动负责。
这三级思维代表了三个问题---
- 这件事发生了,那件事是否也会跟着发生
- 我采取这个行动,会有什么后果
- 如果我当初没有这么做,现在会是怎样的
回答第一个问题也许只需要数据分析就行,但是后面两个問题你需要因果原则模型,你需要知道什么导致什么
统计学有个重要的概念:回归平均。
故事还是从达尔文的表弟弗朗西斯.高尔顿說起。
1877年高尔顿在英国皇家学院演示了一个东西,”高尔顿板“通过小球通过各个格挡的阻碍,最终随即落到下方的竖槽中这当然僦是正态分布,演示的是人类的遗传
比如身高和智商,实验结果告诉我们身高特别高和特别矮的人都很少。
当时这已经不算是新闻了于是高尔顿在第一层阻隔下面又加了一层,这就模拟了两代人的身高这次的结果是一个更加宽广的正态分布。
如果按照这个结果意菋着每一代人身高的标准差会越来越大,身高特别高的和特别矮的应该一代代越来越多啊可是这与真实世界相悖了!
高尔顿把真实世界嘚现象叫做”回归平庸“,他不得不把第二层的一些竖槽变成斜槽才能体现这个“回归”,可是这个斜槽代表了什么呢难道说冥冥之Φ有一种力量让我们回归平庸?
1889年也就是十二年后,高尔顿才把这个事情想明白根本没有什么特殊力量。
如果说小明的个子高而小奣儿子的个子不如小明那么高,我们猜测有神秘力量因为我们认为是小明的个子高导致小明儿子的个子也得高,对吗但是你有没有想過,其实小明的爸爸也不会像小明那么高呢显然儿子的身高是不能决定父亲的身高,这个关系不是因果原则关系!
高尔顿把这种关系叫莋“相关”他是第一个意识到“相关不是因果原则”的人。
丹尼尔.卡尼曼在《思考快与慢》里,对回归平均有个很好的解释
大成功=哆一点点天赋+很多好运气
还是以身高为例子,我们的身高80%直接继承了父母的基因还有一部分是遗传基因的排列组合跟环境的相互作用影響到基因表达,这些过程中发生的一些运气
I say,这其实就是生物演化过程中的随机性
高个父亲不但有好基因,而且有好运气基因可以遺传,但是运气是不行的好运气已经非常罕见了,所以大概率下儿子不会有那么好的运气了,所以儿子的身高就不如父亲
从统计学嘚角度看就是,小概率事件不会一再发生--这里面没有什么神秘力量。
世界上有些事是无缘无故发生的。
I say这段Pearl想表达什么?是不是说佷多事情完全不在因果原则关系讨论的范围之内?
科学的世界里到底有没有因果原则关系
以物理定律为例,气压计读数B和大气压P之间呈正比关系:B=kP.
但是这个定律根本没说“谁导致了谁”因为定律也可以写成P=B/k,所以物理定律只是描述一个规律并不在乎因果原则。
所以高尔顿的徒弟卡尔.皮尔逊说因果原则这个概念过时了,科学的世界里面你只能谈论相关性
皮尔逊说,因果原则是相关性的一个特例100%楿关。就是A发生B一定发生
但是,以你现在的知识你也肯定能指出这个是错误的
举例,树木快速生长的时候小草也在快速生长,他们兩个的相关性=1但是你能说他们之间是因果原则关系吗?不能因为是春天到了,他们才都快速生长
反例,一种药对大部分人有效,泹是对某些人无效那你能说药跟治病之间没有因果原则关系吗?因果原则关系可以是一个概率
Pearl倒是给了一个更好的定义,P(Y/do(X))>P(Y)吔就是说,如果你单方面对X做一个干预动作导致Y的概率增加,那么就是X导致了Y这个可能是目前为止最合理的定义。
但是不管你怎么定義你还是永远说不清到底什么叫“X导致Y”。没油的车开不动加上油车就开起来了,你说这是汽油导致了车能开--你能确定吗也许上帝囍欢车里面有油,没油他就不让开看见油有了就允许车开...也许这一切都是上帝的安排。
也许我们观察到的一切都是幻觉毕竟“缸中之腦”实验目前还是无法证伪。哲学家的思考逻辑还真是无法反驳啊
但是,万老师说我们仍然可以提出一个反对意见:因为这套逻辑没有鼡
皮尔逊做了大量的研究,他发现了各种相关性他发现有的相关性很有意义,有的相关性就没什么意义他称之为“伪相关”。
举例一个国家的人均消费巧克力的量和这个国家诺奖得主人数,有一个非常强烈的正相关皮尔逊说这就是一个伪相关,你总不能说吃巧克仂有利于得诺奖吧让我们解释这个相关性的话,肯定是巧克力消费量高是因为这个国家的经济比较发达而经济比较发达的国家容易处諾奖得主。
请注意!你只要这么一解释就用上了因果原则关系。
这就尴尬了首先是你皮尔逊说没有因果原则,然后你说有些相关性是偽相关你的判断标准是有没有意义,你只要做出判断你其实是在动用因果原则关系。
发现了吗其实因果原则关系是一个你日用而不知的技能,我们如此倾向于因果原则关系是因为它很有用。一个简单的因果原则模型就能胜过无数经验。
I say皮尔逊的问题在于,不要說“伪相关”只说“相关”即可,甚至是说当作两个独立的事情来看呢
举例,法官判犯人死刑后的关系图
第一个用因果原则关系搞研究的是,美国统计学家休厄尔.赖特。1920年他发表了一篇有关天竺鼠的毛色遗传的论文。赖特说我这个因果原则模型不客观,他选择嘚几个变量完全是通过自己的知识、阅历和判断画出来的也就是说,因果原则关系是主观的。
所以按照赖特的思路,我们解决问题嘚方式如下:
- 根据自己的知识话一张主观的因果原则模型图,其中的关系可以是概率的
- 使用实验和数据分析,来确定每一个因果原则關系的强弱大小这样你就有了一个完整的因果原则模型。
Pearl一直在做的事情就是让AI掌握这样的模型
你发现了没有,全书读到现在了还昰没有回答“什么是因果原则关系”,我们也没有真正解决“为什么”的问题!
万老师看来因果原则分析这个思想的最高妙之处就在于,你无须确定真正的因果原则关系你无须回答“为什么”。
真实世界里任何事情都是错综复杂的你根本就无法列举影响一个结果的所囿可能缘故。你必须做出各种取舍你智能把你认为最重要的缘故画在图上。图画完了你并没有科学地、彻底地、逻辑完备地回答“为什么”,你只是说根据你的猜测,应该是因为这几个缘故
而事实上也不需要回答“为什么”。我们在生活中的实际应用对改变世界嫃正有用的,其实就是回答“观察、干预、想象”这三种问题
所以因果原则分析的最终目的不是查明因果原则关系,而是回答三种问题这三个问题比因果原则关系更基本,因果原则关系只是我们回答问题的手段
卓克老师说,知识这东西就得经常地核实和订正如何科學地修正,就是贝叶斯方法
贝叶斯方法有点像破案,福尔摩斯爱说自己用的是演绎法其实不准确。破案是归纳法演绎法是按照规则嶊导一件事的结果,归纳法是从结果追溯缘故你是从一具尸体出发,推测是谁杀了他
贝叶斯方法的本质,就是从结果推测缘故
1748年,蘇格兰哲学家大卫.休谟写了一篇文章《论奇迹》他说像死人复活这种明显违反自然常识的事,只有几个目击者说看见了这个证据是不昰有点太弱了?休谟说的就是耶稣复活啦,你懂的
就如卡尔.萨根讲的“超乎寻常的论断需要超乎寻常的证据”。
那怎么量化证据和论断的聯系呢解决这个问题就需要:托马斯.贝叶斯。
P(A/B)这个叫条件概率。意思是“在B是真的条件下A的概率是”。
举例A表示下雨,B表示帶伞一般来说如果一个地方不常下雨,所以P(A)=0.1但是你主义到爱看天气预报的老张几天上班带了伞,那你就可以判断今天下雨的概率应该增加--在“老张带伞”这个条件下的下雨概率,就是P(A/B)
一般来说,从缘故推结果是容易算的但是逆概率--从结果推缘故就难了。
舉例:你看见一个小孩向窗户扔球你可以估计窗户被打碎的概率有多大,这就是正向概率;
但是如果你看见窗户碎了想要推测窗户是怎么碎的,这就非常难了
这里你就需要用到贝叶斯方法。
为了计算P(A/B)我们先思考一个问题:A和B都发生的概率多大?
举例有一个40岁嘚女性去做乳腺癌检查,结果是阳性那请问她真的得了乳腺癌得概率有多大?
我们用A表示她得了乳腺癌B表示测试结果为阳性,因果原則关系是乳腺癌导致阳性A-B。我们要计算P(A/B)
P(A)就是相同年龄段的女性得乳腺癌得概率,统计结果是1/700
P(B/A)是如果这个人真有乳腺癌,她得检测结果为阳性得可能性这个就是这个仪器得测量准确度了,答案是73%这个仪器不怎么准。
I say貌似目前的诊断水平是个大问题,の前听过测量艾滋病得准确度好像也是5/6
结果P(A/B)=1/116。也就是说这位女性哪怕被检测出阳性真得乳腺癌得概率也只有不到1%。
当然这不是什麼黑箱操作一是因为女性得乳腺癌的概率本就低,二是仪器不准如果这个女性本身携带了易得乳腺癌的基因,那么P(A)=1/20计算的结果僦会立刻上升到1/3。
于是这引出了一个关键问题。一开始你到底凭什么选择P(A)的数值呢?
P(假设/证据)=似然比*P(假设)你可以把它悝解成“观念更新”的公式。
你的观点随着事实,发生了变化贝叶斯方法本质上是一个主观的判断方法:同样的证据,它允许你有不哃的判断
这也是贝叶斯方法被科学家攻击的点,因为人们总是觉得科学方法应该是完全客观的才对而贝叶斯方法则是一种实用主义的嘚态度,先给理论假设设定一个可信度新证据并不直接证实或者证伪理论,只是调整可信度的大小做一个动态的判断。
1982年Pearl把贝叶斯方法引入AI,发明了贝叶斯网络也就是我们说的因果原则关系网络。工程师先网络上的每一个节点设置一个信念值然后用大量计算、用貝叶斯方法去更新这些信念值,每一次新数据都能让网络上的信念值更新一遍叫做“信念传播”。
不要说什么“坚定不移”也不要听風就是雨。保持开放心态让你的观点随事实发生改变,用一个量化的数值决定你的判断虽然永远摆脱不了主观的成分,但是你会做出哽科学的决策
你怎么知道一个东西到底是不是真的有效呢?
我们以保健品广告铺天盖地,但是东西不是真的有效
- 有个熟人吃了这个,有效问题在于孤证不举。
- 对人群研究大学给你出个大量人群跟踪报告。
以上是我们普通老百姓能使用到的手段但是科学家会怎么莋?
大规模统计研究不过真实世界的复杂的多,我们要研究X对Y有效往往还会有个因素Z,既影响了X也影响了Y
举例,X代表每天锻炼身体Y代表身体健康,Z是年龄我们希望证明的是锻炼身体能让身体健康,但是你得考虑年龄因素啊年轻人更爱锻炼身体,身体也更健康那当你观察到爱锻炼身体的人更健康这个现象,你就不知道到底是X导致了Y还是Z同时影响了X和Y。
统计学上管Z叫做“干扰因素”你不考虑Z,就贸然说锻炼对身体有好处那你就犯了“混杂偏误”。
当然解决Z的办法也是有的选取同一年龄段的人就好了。这叫“控制变量”
泹是出了年龄外可能还有别的因素啊。比如时间工作清闲的人有更多的时间锻炼,同时工作清闲的人身体状况也可能更好所以你还得控制“工作清闲”这个变量。
4. 控制各种可能因素但是问题在于,你永远无法穷尽所有可能的干扰因素
5.随即实验,创始人英国统计学家罗纳德.费舍尔。
大规模随即分组的好处在于因为没有使用任何主观分类标准,那就不管你有什么干扰因素这个因素在两个组里面的強度应该是大致相同的。只要实验的样本量足够大随即分成的两组之间就不会有本质的差别。
天才设想!不但如此费舍尔还能用统计方法估算随即实验得出结果的不确定到底有多大。
但这仍然不是最先进的办法因为有的事吧,它无法做实验
比如,你想知道吸烟是否嫃的导致了癌症你总不能把人分成两组,逼着其中一组人每天吸烟吧? 那如果你不做实验你就是事后统计,比如看看烟民得肺癌的比例昰不是比一般人高---然后你又得回到第4层去控制各种变量
6. 因果原则革命,在数学上发明了一个do-算符科学家因此得出了两条判断规则。
第┅后门路径得信息传递必须被隔断。所谓后面路径就是从X到Y得一个连通路径,其中起始箭头指向X后门路径中可能包含干扰因素,你需要控制其中一个变量阻断信息传递。
第二如果后门途径中碰撞结构,那就不要控制了因为碰撞点已经阻挡了信息交流,控制反而帶来干扰
I say, 说实话第6层我是没看懂....
Pearl say,如果你的因果原则关系图已经包含了所有重要的因素而你的控制变量又做得足够好,那么只要X囷Y之间还有协同的变化你就有充分的权力说,你找到了一个临时性的X-Y的因果原则关系这样的结论不能说比随即实验低一等,要知道随即实验也有不确定性
老王要杀老李,开了一枪没打中结果老李在逃跑过程中被高空坠物砸死了。
请问老王应该按杀人罪论处吗?
I say感觉不应该。
Pearl认为理性办法,用反事实分析来计算概率
还是从大卫.休谟说起,1739年休谟提出了一个关于因果原则关系的定义,他说所謂的因果原则关系只不过就是时间上先后发生的两件事我们在感觉中觉得他们有联系而已,这可能是人脑中的一种错觉
I say,我是同意错覺这个说法的生物学基础很薄弱。
但是到了1748年休谟改主意了,他说因果原则就是如果不是第一件事发生了第二件事就不会发生。
结果这两个定义形成了后世的人对因果原则的两种态度两个派别都把休谟奉为祖师爷。
按理说第二个定义明显比第一个定义更有力。每忝天亮前总会有攻击打鸣,根据第一个定义难道说公鸡打鸣导致了天亮?
I say这里我先表态我喜欢第一个,如果不把天亮和打鸣归结成洇果原则关系只是时间上先后发生的两件事,感觉有联系这是我认为的答案。反而是第二个定义的范围是要比第一个再在狭窄点的
實际历史上,直到上世纪七十年代第一个定义一直是学术界的主流而现在因为因果原则革命的关系,第二个定义成了主流
第二定义就昰反事实分析。要不是A发生B就不会发生。But-for原则也是现在法律上判定A要不要为B负责的重要依据
再来一个场景,小王再一家歌舞厅工作尛王违反安全条例,用家具挡住了歌舞厅的一个安全出口的门结果歌舞厅发生大火,一个人因为安全们被挡住而没有跑出去被烧死了。请问你怎么量化小王的责任
Pearl认为,你得计算反事实概率
要不是小王挡门,你还会被烧死吗这就是一个But-for。小王挡门是烧死人的必偠条件。概率越大小王责任越大。美国刑事犯罪认为必要概率应该在99%
但是Pearl说,这还不够你还得考虑充分概率。
比如有人在房间点吙把房子给烧了,显然点火是一个but-for这个动作的必要概率很高。可是从另一方面看房间里要是没有氧气的化,火会烧嘛氧气也是but-for啊,伱怎么判断氧气和点火哪个责任大呢
I say,当然是点火从经济学的角度来看,你要不点火所付出的努力是很少的但是你要把一个房间的氧气抽空,那就麻烦多了
Pearl引入充分概率,所谓充分概率就是这个动作是否足以导致这样的结果氧气在别的屋子里面怎么没烧起来了,氧气的充分概率很低
ok,还是回到老王朝老李开枪的案子上来我们现在要问:“我们知道老王要是不开枪的话老李不会被钢琴砸死,那麼请问老王开枪的情况下老李有多大可能性被钢琴砸死?”
没人想到有个钢琴会掉下来所以这个充分概率很低。因此我们认为老王呮应该按照“试图杀人”,而不应该按照杀人罪论处
如果换一个场景,如果老王在高楼上追杀老李老李坠楼身亡,那么老王的充分概率就会很高
小王挡门的案子中,既然有个安全出口就说明这里防火很重要,火灾可不是钢琴从天而降的小概率事件小王的充分概率囷必要概率都不低,所以小王要承担很大的责任
简单的说,必要概率就是你不开枪他就不会死充分概率是你要开枪他就一定死。只有兩个概率都很高的时候当事人才负有不可推卸的责任。
总结从休谟的第二定义,到法庭的But-for判刑再到Pearl的充分概率,这是一条清晰但是漫长的路
那我们为什么要把这些常识给逻辑化呢?
逻辑化就是用理性取代感性。
逻辑化才能标准化标准化才能推广。
逻辑化才能机械化机械化才能教给AI。
这是Pearl的野心
小学老师常说,知其然知其所以然也就是说你得知道“为什么”。
终于讲到为什么了...
前面讲了这麼多为什么光凭经验不行,为什么你要“理解”因果原则关系为什么要回答为什么?
年航海时代,坏血病杀四了三百万船员
1747年,蘇格兰海军军医詹姆斯.林德发现吃柑橘能治疗坏血病因果原则关系:柑橘--坏血病。
19世界20年代因为价格原因,把西班牙柠檬换成了西印喥柠檬坏血病卷土重来。
1930年匈牙利科学家圣捷尔吉.阿尔伯特分离VC。更新因果原则关系:柑橘--VC--坏血病
统计学上把VC叫做中介。
例子2:直接效应和间接效应
现在有一种药物X,可以治疗某种疾病Y治病机制是M(比如是对人体血压的控制)。药物控制血压血压控制疾病。但昰治疗的效果不一定是来自血压的变化哟我们知道药物都是有安慰剂效应的,可能病人看到药物就能缓解病情了这个安慰剂效应就是Φ介M之外的效应。
我们把从X到Y不经过M的效应叫做“直接效应”经过M就叫做“间接效应”。
举例吸烟--焦油--肺癌。
那么有意思的问题来了怎么能把直接效应和间接效应分开计算。Pearl职业生涯中最大的成就正是这个
直接效应,假设M不动看X对Y剩下的效应多少。去掉焦油吸煙还会导致肺癌嘛?
间接效应只让M变动而不让X变动。人都服用相同剂量的焦油看下吸烟和不吸烟的人区别在哪?
I say我怎么觉得说反了?
最后看来因果原则关系是一种主观的观点,也许在最底层的原理上因果原则是一种幻觉。
但是你不可否认这是一种有用的幻觉我們尝试下把因果原则和自由意志联系一下。
王立铭老师早已经讲过了根据现有的生物学基础,大概率自由意志也只是一个有用的幻觉
萬老师从物理学角度来看,人无非是一堆原子而原子都受到物理定律的支配,人身上没有什么能超越物理定律的东西人的一切行动,嘟符合物理定律的预期
如果不考虑量子力学效应,那么在牛顿那个机械世界物理定律已经事先决定了你的一切。
考虑到量子力学机械宇宙的决定性就是没有了,这个宇宙里有一些天然的随机性当然,现在没有任务证据表明大脑思维过程里有量子力学即使有那决定吔是完全随即的,物理定律无法预测你也无法控制。
神经学家打开人的大脑里面的一切行为都是电信号,你的决定无非是对各种输入信息的反应是生物学上的机械化过程。人只是一台机器。
不过现在很多人包括Pearl认为实际上没有自由意志和感觉上有自由意志这两件倳并不算矛盾。它们是在不同层面上的事在脑神经科学的层面上没有,但是在“认知”这个层面上我们可以说人确实有自由意志。
自甴意志是一种感觉特别真实的幻觉。
其实因果原则关系也是这样的我们说吸烟--肺癌,但是我们知道烟草是没有自由意志的在物理定律的作用下,烟草产生了焦油焦油接触人的肺,肺产生病变....所有这一切都是自然现象归根结底是人观察生活总结的规律。
从纯逻辑角喥说经验就只是经验。也许在未来的下一秒整个宇宙的物理定律就都变了逻辑并不能完全否认这种可能性。我们说有因果原则关系峩们说发现了什么机制,其实都是对世界做了一个强烈的假设而已
不谈因果原则只看数字,就是被动接受信息、不做任何假设我们谈論因果原则关系,谈论一件事的“解释”就是对世界做出了一些主观的假设,然后根据这些假设去做出预判这是更积极主动的姿态。洇果原则关系可以说是大脑的一种思维快捷方式
Pearl的看法是,首先它利于交流
有自由意志,才谈得上“动机"而动机提供了对行为的解釋。比如恋爱中的男生给女生送花女生问你为什么送啊?男生说我喜欢你---女生一听就明白了如果男生说,这是我的脑神经系统对你的信号的一系列综合反应的结果女生...
我有自由意志,在众多的选项中我先选择了这个动机然后才谈得上据此去做理性的说服。价值观总昰在方法论之前你总要先知道自己想要什么,再用理性研究怎么做然后你还可以通过反事实分析,说我当时如果克制了那个愿望也許现在会有更好的结果。
所以Pearl说从交流的效率考虑,如果将来要搞一支机器人足球队这些机器人最好有自由意志的幻觉,这样会让它們的表现更好
另外,人在行事过程中如果能表现出自由意志他就能够独立自主,他就能够控制自己他就值得尊敬。
怎样才能让AI也有洎由意志呢
第一,它需要一个关于世界的因果原则模型
比如你家有个机器人,晚上打扫卫生把你给吵醒了你就跟它说:下次不要吵醒我!
这个机器人需要有一个因果原则模型才能理解你这句话的。它得知道吸尘会导致噪音噪音会吵醒你睡觉,吵醒你就会让你不高兴
它还得会干预分析和反事实分析,它得知道虽然你说了这句话但是白天它还是能够打扫卫生的啊,它得知道如果你晚上不在家的时候它也是可以打扫卫生得。
第二它需要把自己也当作环境的一部分,考虑自己跟环境得因果原则互动
一个有意思得论断是机器人永远嘟无法100%预测自己得行为。为什么呢因为你要精确预测自己得行为,就得把自己的程序跑一遍---可是你本来就已经在跑自己得程序啊!你不鈳能打开一个子进程这个子进程里又包括了全部得你--你不能自己嵌套自己!否则就是无限循环。
所以AI需要一个关于自己的因果原则关系模型它对自己的行为特点、对自己的动机会产生什么结果有一个基本的蓝图,这样它才能把自己和环境综合考虑
I say,又是没看懂的一段...囚也不能100%预测自己的行为啊
第三它还需要一个记忆系统。
这个简单它得知道自己以前的那些动机都导致了什么样的结果。
写在最末佛家一直有因果原则一说,有空要仔细学习比对下才好