生成式人工智能
丁磊
前言
人从出生开始,就在不断通过视觉、听觉、嗅觉、味觉、触觉等各种方式认识这个世界。我们通过不停地与外界接触、学习,逐渐长大成人,再通过专业课程的学习在某些方面获得一技之长从而立足于社会,并试图改造世界。
“硅基”AI(人工智能)也按照类似的模式成长,但是相比于“碳基”人,它在速度方面极具优势。AI经历了从最初的机器学习到神经网络,再到Transformer模型的发展,2022年底ChatGPT以及2023年初GPT-4横空出世,引燃了公众对生成式AI的关注,其中最让人激动的就是AI大模型已经初步具备了人类的通识和逻辑能力——这恰恰是之前的AI所缺失的。此前,无论是AlphaGo还是AlphaFold,最多只能称作其各自领域的“专家”,而ChatGPT是通用的。
正如OpenAI首席科学家、ChatGPT背后的技术大佬伊利亚·苏茨克维(Ilya Sutskever)所说,GPT(生成式预训练模型)学习的是“世界模型”。他将互联网文本称作世界的映射,因此,将海量互联网文本作为学习语料的GPT学习到的就是整个世界。在我们认识世界的同时,GPT模型也以惊人的算力,快速地获取我们数年甚至数十年才能拥有的认知,即将成为一个接近成年人思维水平的“世界模型”。
不仅如此,已具备了“世界模型”能力的GPT还能够生成“万物”。当然,如苏茨克维所说,这里的万物指的是世界万物在数字空间的映射,包括文本、图片、音频、视频、剧本、代码、方案、设计图等一切和我们生产、生活息息相关的事物。因为GPT模型在一定程度上可能已经具备了成年人的通识和逻辑,所以我们只需要拿特定专业领域的数据对其再做训练(称为“微调”),它就可以成为独当一面的专业人才,可能成为艺术家、设计师、程序员、工程师或广告优化师、供应链专家、客服人员等。这也许就是生成式AI或者说AIGC(AI generated content,人工智能…