生成与推理

肖睿 吴寒
前言 工具和火的使用让人类成为高级生物,语言和文字为人类形成社会组织和社会文化提供了支撑。之后,人类历经农业革命、工业革命、能源革命、信息革命,终于走到今天的“智能革命”。薛定谔认为熵减是生命的本质,而第二热力学定律认为熵增是时间的本质。宇宙中生命的意义之一就是和时间对抗,而对抗的工具就是智能,智能的基础就是信息和信息熵。 智能可以分为生物智能、工具自动化、人工智能等。其中人工智能(Artificial Intelligence,AI)主要是指机器智能,从早年基于知识工程和符号系统的传统人工智能(AI 1.0)已经进化到当今基于数据和统计学习的现代人工智能(AI 2.0),包括机器学习、深度学习,以及以ChatGPT和DeepSeek为代表的大模型技术(大模型也是本书讨论的主要内容)。现代人工智能的本质是数据智能,基于数据模型来提供分析能力和预测能力,主要适用于三种问题场景,或者说基于三个假设才能发挥作用:一是研究对象在问题领域的描述数据或观测数据要足够丰富和完备;二是研究对象在时间变化中存在内在规律;三是过去的数据和未来的数据是同构的,可以以古鉴今。根据以上对人工智能的理解,我们能够清晰地判断当前人工智能能做什么、不能做什么,既不忽视其技术潜力,也不盲目将其神化。 很多人会把人工智能技术归属为计算机技术,但我认为计算机技术仅仅是人工智能的工具,而人工智能技术的核心在于问题抽象和数据建模。若将人工智能技术比作天文学,那么计算机技术则可比作望远镜,两者之间关系紧密,却又不尽相同。至于其他计算机应用技术,例如手机应用、网络游戏、计算机动画等技术,则可以类比为望远镜在军事、航海等领域的应用。如果将传统的计算机应用技术称为软件1.0,现代人工智能技术则可以称为软件2.0。软件1.0的核心是代码,解决的是确定性问题,对于问题解决方案的机制和原理是可以解释的、可以重复的;软件2.0的…