ChatGPT等大模型,其实就是缸中之脑。
给出这番判断的,不是别人,而是世界知名计算机视觉专家、统计与应用数学家、人工智能专家、北京通用人工智能研究院院长、北京大学讲席教授兼智能学院、人工智能研究院院长、清华大学基础科学讲席教授朱松纯。
缸中之脑是哲学家希拉里·帕特南给出的思想实验。该实验假设将人的大脑与身体剥离,大脑被放入一个能够维持其技能的盛有营养液的容器中,一台联结大脑神经元的超级计算机负责制造出各种幻象,让大脑误认为一切正常。
ChatGPT等大模型的构造原理在于,以统计建模在大量文本上进行训练,学习文本之间的语言学相关关系,从而根据上一个词语预测下一个词语。这也意味着,如果用户启动一个话题,让大模型进行对话,就会很快陷入相互“谢谢”的进程。
朱松纯教授指出,大模型的智能与其说是内在的,倒不如更确切地定义为“人类智能的投影”。大模型生成的文本本身并不具有意义,其意义完全取决于人类用户对文本的阐释。从这个意义上而言,对ChatGPT等大模型的应用深度和广度,其实取决于具体应用的人的眼界、知识、问题意识、提出问题的能力。那些认为可以通过大数据来改变认知的观念,还是过于乐观了。
朱松纯教授在其所著的《为机器立心》一书中指出,大模型训练数据集的不透明性,以及人类评估时所采取的指标差异,可能导致人类高估大数据的真实性能。
这也是而今很多用户已经发现的,ChatGPT等大模型不仅会生成“林黛玉倒拔垂杨柳”一类的谬误图画、视频和文字描述,而且还会出现虚假涌现,也就是说给出完全有悖于科学或社会常识的问题回答。研究人员测试的结果是,大模型在创造力方面的表现远远不如人类,甚至在某些方面达不到儿童的水平。加州大学伯克利分校认知心理学教授艾利森·戈尔尼克就指出,大模型是一种模仿机器,缺乏认知推理所需的创造力。
实际上,人类从婴儿、幼童到成人,采取的是“小数据、大任务”的范式,也就是少量观测数据可以积累经验,通过内化思考最终形成解决问题、应对局面的能力。相较而言,现在的大模型、机器学习采取的是“大数据、小任务”范式。
《为机器立心》这本书介绍了朱松纯教授等中国和国外科学家在通用人工智能方面的探索进展。朱松纯教授2020年回国后,牵头建立了北京通用人工智能研究院,致力于建立起更高水平的通用智能,以“小数据、大任务”的技术范式,打造价值驱动的通用智能体。目前正在打造的第一个通用人工智能小女孩“通通”,已经能够在物理逼真的复杂动态场景中完成很多儿童日常生活中的任务。
按照书中的解释,通用人工智能而非简单意义上的大模型,更可能符合三个基本特征:第一,无限任务。也就是说,智能体包括人,需要完成无穷无尽的任务,能够在复杂环境中处理无限多项没有预先设定的任务。如果人工智能必须依托于预设模型,处理简单单一或几项任务,无法适应复杂技术、社会环境,这样的开发显然就是失败的,或者说远未达到“智能”的层次。第二,自主生成任务。也就是说,智能体必须能够应付和现实生活一样的随机要求,书中打比方说,如果孩子拿着一个对于他来说颇具危险性的小物件,未经过该物件数据训练的智能体应当能够自主识别出该任务的不合理之处,并形成保护孩子安全的新任务。第三,价值驱动和价值对齐。也就是说,智能体应当融入人类的基本价值观,使得智能体有能力学习和理解人类的价值偏好,最终实现与人类价值的对齐。
人工智能的模型范式从低到高包含三个层次:统计模型、因果模型、价值模型。大模型是典型的数据驱动的统计学习模型,存在明显的有“理”无“心”的问题。因果关系源于人类对环境中因果的抽象概念理解,而因果模型之上是价值模型,也就是书作者所说的认知架构和价值体系。朱松纯教授指出,人工智能的研究需要由“理”向“心”转变,从统计模型转向价值模型。
《为机器立心》书中叙述了如何训练智能体的因果推理与学习、认知推理、语言通信,最终使其具备人类的价值观。这方面训练,无疑大量应用、参照了人类婴儿的行为决策与价值判断形成、强化过程。善恶判断实验、公平观念实验、合作精神实验等行为决策实验证实,人类婴儿已经具备大量先天的价值判断,能够指导自身在无知识背景下的决策。
基于对人工智能发展历史的归结,以及现有研究的总结,书作者提出,通用人工智能的研究目标是“寻求统一理论框架来解释各种智能现象,并研发具有高效的学习和泛化能力,能够根据所处的复杂动态环境自主定义、生成并完成任务的通用智能体,使其具备自主的感知、认知、决策、学习、执行和社会协作等能力,且符合人类的情感、伦理与道德观念”。《为机器立心》书中为此详细阐释了如何构建通用人工智能的认知加过、自我意识、社会智能、价值驱动、价值函数、具身智能、可解释性、价值对齐。
书名:《为机器立心》
作者:朱松纯
出版社:浙江科学技术出版社
出版日期:2024年12月