网站首页  英汉词典  古诗文  美食菜谱  电子书下载

请输入您要查询的图书:

 

书名 百面大模型
分类 教育考试-考试-计算机类
作者 包梦蛟,刘如日,朱俊达
出版社 人民邮电出版社
下载 抱歉,不提供下载,请购买正版图书。
简介
编辑推荐
面试题库:二星到五星难度体系,约100道大模型高频真题按考点分类,附面试题目录,助你高效查漏补缺
内容全面:涵盖MoE、预训练、后训练、SFT、PEFT、RLHF、PPO、GRPO、DPO、FlashAttention、RAG、智能体以及DeepSeek MLA等
作者靠谱:5万+粉丝AI大V“包包大人”领衔,联合美团大模型技术专家与北航实力派新生代,强强联手打造
大佬推荐:ACL Fellow刘群、ACL Fellow周明、《深度强化学习》作者王树森和黎彧君、知乎大模型频道技术博主猛猿、LLaMA Factory作者郑耀威、OpenRLHF和REINFORCE++作者初七、字节跳动火山引擎机器学习平台研发负责人方佳瑞等8位行业大佬力荐
内容推荐
本书收录了约百道大模型工程师常见的面试题目和解答,系统、全面地介绍了与大模型相关的技术,涵盖语义表达、数据预处理、预训练、对齐、垂类微调、组件、评估、架构、检索增强生成(RAG)、智能体、PEFT(参数高效微调),以及训练与推理等内容。书中通过丰富的实例、图表及代码讲解,将复杂概念阐释得通俗易懂,是大模型领域的一本的实用指南。
本书适合对大模型和Transformer等技术感兴趣的学生、研究者和工程师阅读和参考。
目录
第1章 语义表达 1
1.1 词向量与语义信息 1
1.1.1 稀疏词向量 2
1.1.2 分布式语义假设 2
1.1.3 稠密词向量 3
1.2 溢出词表词的处理方法 6
1.3 分词方法的区别与影响 11
1.3.1 词(word) 11
1.3.2 子词(subword) 12
1.3.3 字符(char) 16
1.4 词向量与语义相似度 17
1.5 构建句子向量 19
1.6 预训练的位置编码 22
1.7 BERT的不同嵌入类型 25
1.8 大模型语义建模的典型架构 27
第 2章 大模型的数据 31
2.1 大模型训练开源数据集 31
2.2 大模型不同训练环节与数据量 35
2.3 大模型数据预处理 39
2.3.1 数据的质量 39
……
书评(媒体评论)
身处大模型的热潮之中,想快速掌握关键知识?本书紧紧围绕大模型发展的核心要点展开,用问答形式提炼精华,通俗易懂。不管你是刚入门的新手,还是经验丰富的行家,都能高效获取知识。
——周明,ACL Fellow,澜舟科技创始人
近期,大模型和强化学习的结合展现了AI在知识推理上的巨大潜力。大模型领域知识繁杂,个人学习常需在多处搜寻碎片化信息。这是一本难得的好书,为读者提供了系统化的学习路径。全书内容涵盖面广且实用性强,从数据准备、模型结构、分布式训练,到偏好对齐、模型评估等核心环节一应俱全,既有深入浅出的概念讲解,又配有关键的案例代码。真诚推荐所有对大模型感兴趣的人阅读这本书,它不仅能帮你理解内在原理,还能指导实际应用,助你开启AI探索之旅。
——《深度强化学习》作者团队:王树森,前小红书基础模型团队负责人,现Meta Staff Engineer;黎彧君,华为诺亚方舟实验室语音语义主任工程师
在大模型资料遍布的时代,了解定义不难,难的是掌握细节。在广度上,本书涵盖了大模型从业者需知需会的技术话题;在深度上,本书以通俗易懂的方式做了技术剖析。它不仅仅是一本面试经典,更是一本实操指南。我加入的第一个高质量大模型社群,就是由“包包大人”运营的,在这里我认识了俊达和如日。俊达虽不是科班出身,但他具有极强的工程实践能力,善于总结。如日对待理论细节严谨认真,并在动手推动大模型落地上极富热情。写书的方法和关注点与写博客相辅相成,与他们三位的讨论时常能激发我对大模型相关知识的源码级二次理解,因此我在写博客的时候也更能发挥自己重视实现细节、辅以画图解析的特色。衷心向大家推荐这本诚意之作!
——猛猿,知乎大模型频道技术博主
通过开源项目实战是学习大模型的很好方式之一,而破解开源项目的黑箱离不开对大模型概念的理解和掌握。如果想要系统地学习大模型的相关知识,非常推荐你阅读这本书。作者用精简的记号和公式清晰、透彻地剖析了大模型算法细节,尤其是像FlashAttention和DeepSeek MLA这种复杂的知识概念。这种深入浅出的讲解方式,极大节约了我的学习时间投入。我相信这本书一定可以帮我在实践中充分结合理论知识,更流畅地完成大模型落地应用。
——郑耀威,LLaMA Factory作者,北京航空航天大学博士生
在大模型的发展过程中,模型的优化从来都不能脱离系统的约束,真正的落地方案需要模型和系统的协同优化。本书不仅介绍了模型训练、微调、推理加速等算法层面的核心知识,还深入探讨了高效并行计算、分布式等系统层面的关键技术。此外,书中还提供了代码分析,帮助读者理解从底层原理到工程实现的全流程,使理论与实践紧密结合。这是一本真正的全栈式大模型学习资料,而不仅仅是一本面试经典。
众所周知,对大模型从业者来说,不仅要掌握模型优化方法,还要理解系统架构对性能的影响,这样才能在实际应用中做出很优决策。本书以通俗易懂的方式剖析了这些技术细节,使读者能够全面掌握大模型的核心能力,从原理到实践构建扎实的知识体系。
——初七,OpenRLHF、REINFORCE++作者,NVIDIA高级工程师
在ChatGPT引领的AI浪潮中,大模型正重塑行业格局,但高昂的算力成本和人才缺口亟需一本降低入门门槛的实践指南。此时,本书应运而生,开创性地采用“面试题问答”的形式,在理论与实践之间架起了一座坚实的桥梁。对初学者而言,本书提纲挈领,可以帮助他们快速构建知识体系;对从业者来说,本书既是查漏补缺的实用工具,也是夯实基础的不错选择。
希望更多读者能够通过本书参与到AGI浪潮中,在这个充满机遇和挑战的时代,掌握大模型技术,为推动AI的发展贡献自己的力量。
——方佳瑞,字节跳动火山引擎机器学习平台研发负责人
随便看

 

Fahrenheit英汉词典电子书栏目提供海量电子书在线免费阅读及下载。

 

Copyright © 2002-2024 frnht.com All Rights Reserved
更新时间:2025/11/25 9:00:23