大语言模型：原理、应用与优化

零基础理解、构建、使用大模型

作者苏之阳王锦鹏姜迪

类别出版 / 非虚构

出版社机械工业出版社 / 2024-10

提供方机械工业出版社

字数约 123,000 字

ISBN9787111762768

暂无评价综合评分的显示会考虑用户真实性等多项因素，每部作品出现综合评分的时间不定。

开通会员，可免费在线阅读本书，首月特惠去开通

全本定价￥53.00

作品简介

这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手，详细梳理了大模型技术的发展脉络，深入探讨了大模型预训练与对齐的方法；然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理，展示了这一系统性工程的复杂性与实现路径。

苏之阳，博士，毕业于香港科技大学，现任小冰公司研发总监，专注于自然语言处理产品的研发工作。他主导了小冰框架、小冰智能评论和XEva等项目的架构设计和开发，特别是在大语言模型的研发与应用方面具有丰富的经验。他曾任微软公司资深研发工程师，并在国际学术会议和期刊上发表多篇高水平学术论文。他的研究兴趣涵盖自然语言处理、深度学习以及云计算等领域。

王锦鹏，博士，致力于自然语言处理和推荐系统的研发，拥有在微软亚洲研究院等科技公司担任关键技术岗位的经验，参与了Office文档预训练、推荐大模型等多个重要项目的研发和优化工作。在国际会议和学术期刊上发表了逾30篇高质量论文，并在ACL、EMNLP、AAAI等顶级会议中担任审稿人。

姜迪，博士，拥有十余年工业界研发和管理经验，在雅虎、百度等知名互联网企业工作期间，为企业的多个关键业务研发了核心解决方案。在自然语言处理和数据挖掘领域的会议和期刊上发表了数十篇论文并出版了多部学术专著，获得了多个最佳论文奖和CCF奖项，还在IJCAI、WWW、AAAI、CIKM、COLING等多个会议担任委员会成员。

宋元峰，博士，曾就职于百度、腾讯等互联网公司，在人工智能产品开发领域拥有丰富的经验，研究涉及自然语言处理、数据挖掘与可视化等方向，并在KDD、ICDM等国际学术会议和期刊上发表多篇论文。

大语言模型：原理、应用与优化

作品简介

作品目录