图灵奖得主Hinton：我已经老了，控制比人类更聪明的AI交给你们了

2023-06-12 15:07:54 来源：量子位

萧箫发自凹非寺量子位 | 公众号 QbitAI

还记得大牛们就“AI是否可能灭绝人类”，分成了两大阵营吗？

由于并不理解为啥“AI会造成风险”，吴恩达最近开启了一个对话系列，去找两名图灵奖得主聊聊：

(资料图片)

AI究竟存在哪些风险？

有意思的是，在相继和Yoshua Bengio以及Geoffrey Hinton进行深度对话后，他和他们“达成了不少共识”！

他们一致认为，双方应该共同讨论AI具体会产生什么风险，以及它究竟“理解了什么”。Hinton还特意cue了“反方代表”图灵奖得主Yann LeCun：

学术界在这个问题上分歧太大了，包括我们非常尊重的学者如Yann，就认为大模型并不理解它自己在说什么。

马斯克对这次谈话也很感兴趣：

除此之外，Hinton最近还在智源大会上再一次“布道”AI风险，表示比人更聪明的超级智能很快就会出现：

我们不习惯思考比我们聪明得多的东西，以及如何与它们互动。我现在看不出如何防止超级智能“失控”，而我已经老了。我希望，更多年轻的研究人员能掌握控制超级智能的方法。

一起来看看这些对话的核心观点，以及不同AI大牛针对这件事的看法。

吴恩达对话图灵奖得主：AI安全应达成共识

首先是与Bengio的对话。吴恩达和他达成了一个关键共识，即：

科学家们应该试着找出“AI风险存在的具体场景”。

也就是说，AI究竟会在哪些场景下，给人类带来重大危害、甚至导致人类灭绝，这是双方需要达成的共识。

Bengio认为，AI前景充满着“迷雾和不确定性”，因此找出一些AI具体带来危害的场景是有必要的。

然后是与Hinton的对话，双方达成了两个关键共识。

一方面，所有科学家必须针对“AI风险”议题好好聊聊，以便于制定良好的政策；

另一方面，AI确实在理解世界。科学家们需要列出其中的关键技术问题，这有助于在AI安全议题上达成共识。

在这个过程中，Hinton提到了需要达成共识的关键点，即“GPT-4和Bard这类对话大模型是否真的理解它们自己在说什么”：

有些人认为它们理解，有些人认为它们只是随机鹦鹉。我想我们都相信它们理解（自己在说什么），但一些我们非常尊重的学者如Yann，则认为它们并不理解。

当然，被“喊话”的LeCun也及时赶来，很认真地发表了自己的观点：

我们都同意“大家需要就一些问题达成共识”这件事。我也同意Hinton的观点，即LLM有一定的理解能力，说它们“只是统计数据”是误导性的。1、但它们对世界的理解非常肤浅，很大程度上是因为它们仅仅用纯文本训练。从视觉中学习世界如何运作的AI系统，将对现实有更深入的理解，相比之下自回归LLM的推理和规划能力非常有限。2、如果没有下述条件，我不太相信会出现接近人类（甚至是猫）水平的AI：（1）从视频等感官输入中学习的世界模型（2）一个可以推理和规划（而不仅仅是自回归）的架构3、如果我们有了懂得规划的架构，它们将是目标驱动的，即能基于优化推理时间（而不仅仅是训练时间）目标来规划工作。这些目标可以是让AI系统“听话”且安全的护栏，甚至最终打造出比人类更好的世界模型。然后，问题就变成了设计（或训练）保证安全和效率的良好目标函数。4、这是一个困难的工程问题，但没有一些人所说的那么难。

虽然这一段回应仍旧只字未提“AI风险”，不过LeCun很实在地给出了提升AI安全性的建议（打造AI“护栏”），并设想了比人类更厉害的AI“长啥样”（多感官输入+可推理规划）。

某种程度上来说，也算是双方在AI存在安全问题这个观点上达成了一些共识。

Hinton：超级智能比想象中更近

当然，不止是和吴恩达的对话。

最近离职谷歌的Hinton，在不少场合都谈到了AI风险这一话题，其中也包括最近参加的智源大会。

在大会上，他以《通往智能的两条路线》为主题，讨论了“知识蒸馏”和“权重共享”两种智能路线，以及如何让AI变得更智能，以及自己对于超级智能出现的看法。

简单来说，Hinton不仅认为（比人更智能的）超级智能会出现，而且出现的时间比人们想象中更快。

不仅如此，他认为这些超级智能会失控，但目前他还想不到什么好的方法阻止它们：

超级智能可以通过操纵人来轻易获得更多权力。我们不习惯思考比我们聪明得多的东西，以及如何与它们互动。但它会变得善于欺骗人，因为它能通过某些小说作品中学习欺骗他人的案例。一旦它变得善于欺骗人，就能掌握让人们做任何事的方法……我觉得这很可怕，但我看不出如何防止这种情况发生，因为我老了。我希望，像你们这样的年轻有才华的研究人员，会搞懂我们如何拥有这些超级智能，并让我们生活得更好。

放映出“THE END”幻灯片时，Hinton意味深长地强调了一下：

这是我的最后一张PPT，也是这场演讲的结束。

参考链接：[1]https://twitter.com/AndrewYNg/status/1667920020587020290[2]https://twitter.com/AndrewYNg/status/1666582174257254402[3]https://2023.baai.ac.cn/

关键词：