文章目录

大数据，人工智能和大问题

1. 引言

贝叶斯网络的提出，帮助机器学会在观察中进行部分思考。但是由于缺乏用设想代替现实，并将其和现实进行对比的能力，机器无法回答 “为什么”。

长期以来统计学的 “工作氛围” 束缚了对为什么的探究。许多不同领域的研究者认识到了这个问题，并开始着眼于一个敢于谈论和书写因果关系的新的范式 —— 只要假设足够简明易懂，主张的可信度就可以被判断，对反驳的脆弱度也可以被判断。

尽管当前拥有着海量的数据，但是当回答的问题是因果问题时，这些问题从来不能单靠数据来回答。至少要构建关于该过程的某些方面的模型。相对而言，数据挖掘方法的价值在于能帮助我们能发现某些潜在的关联模式，并据此提出更精确的解释性问题。

大数据在因果推断问题中的最后一个阶段也可能发挥作用，帮助借助被估量推导出估计值。当变量较多时，统计估计的难度不可小觑。

数据挖掘绝不是研究的终结，而是研究的辅助。作者认为大数据和因果推断的合作的一个新的机会是 “可迁移性”（transportability）—— 帮助从研究结果从一个环境中迁移到另一个环境中，比如将某州对广告营销的研究迁移到其它的州。

此外，对于长期困扰统计学家的选择偏倚问题，如果通过因果模型掌握了需要选择了机制，则可以收集正确的去混因子的数据集，并通过适当地重新加权或者公式调整来克服偏倚。

虽然计算机在纯粹的计算能力方面已经远远超过了图灵的希望，但是强人工智能却变成了一个比他想象的更难实现的目标。贝叶斯网络即使拥有了通过数学（尤其是统计和概率）的优势，但是仍然无法处理因果，在该网络中信息可以在两个方向流动。

深度学习尽管拥有很好的效果，但是其（数学）不确定性和不透明性，以及在理论上在观察层面的局限决定了它无法超越因果关系之梯的第一层级。

对于强人工智能而言，干预和反事实能力都是必要的。意图是个人决策的重要组成部分，智能体应当能够认真考虑自己意图背后的原因，自问相反的行动是否会产生更好的结果。理解自身的意图，并作为因果推断的证据。作者认为理解自由意志幻觉的功能是解开它如何才能与决定论相调和的关键。

除了功能问题，还必须解决模拟问题。要作出关键的决定是哪些信号需要优先处理，而决定背后的原因往往很难以回忆和阐明。

作者认为，能够带给思维机器带来智能体效益的软件包至少包括3个组成部分：关于世界的因果模型；关于自身软件的因果模型；用于记录其心理意图对外部事件反应方式的内存。

作者认为：我们没有造出会思考的机器，但是我们能制造出可思考的机器，由于有思考的能力，我们有能力制造出有能力辨别善恶的机器，它应该至少和人类一样可靠，而且有望比人类更可靠。

Tagged with: 因果推断 • 智能