重庆大学图书馆汇采平台

好评度:

(100% reviews)

大模型技术与构建:从入门到实战:插画版

￥89

京东库存 :

ISBN : 9787122486769

商品基本信息：

作者：逻辑简墨
出版社：化学工业出版社
出版时间：2025-10-01
纸书服务：京东发货并提供售后服务

加入购物车

Tags : Fast, Gaming, Strong

详细信息

内容简介

《玩转大模型技术与构建：从入门到实战（插画版）》以人文与科技交融的笔触，引领读者穿越语言与智能交织的文明长河。从人类语言的起源与数字时代的语言变革切入，本书不仅解析了自然语言处理技术的演进脉络，更以Transformer架构为锚点，层层揭开大语言模型从数学原理到工程实践的神秘面纱。书中既有GPT、BERT等里程碑模型的深度拆解，亦不乏情感分析、跨语言处理等前沿场景的实战指南，更以Hugging Face生态与LoRA微调等硬核技术，为读者搭建起从理论到落地的完整桥梁。在理性与诗意的交织中，本书不仅是一部技术手册，更是一扇通向人机协同未来的窗口。

第1章从语言到智能
1.1 语言的起源 2
1.1.1 人类语言的起源 2
1.1.2 语言发展中的重要里程碑 3
1.2 语言在信息社会中的重要性 5
1.2.1 数字化时代中的语言变革 5
1.2.2 社交媒体对语言的影响 6
1.3 人工智能时代的语言技术 7
1.3.1 自然语言处理的定义和应用范围 7
1.3.2 机器翻译与自然语言生成技术 9

第2章走近大语言模型 14
2.1 Transformer：自然语言处理的新趋势 15
2.1.1 文本分类 16
2.1.2 自然语言推理 18
2.1.3 语义相似度计算 20
2.1.4 命名实体识别 22
2.1.5 摘要生成 23
2.2 Transformer初体验：大模型的前世今生 24
2.2.1 Transformer工作原理浅析 24
2.2.2 代码示例：Transformer文本处理 25
2.3 词嵌入和神经网络：大语言模型的基石 29
2.3.1 词嵌入的奇妙世界 29
2.3.2 词嵌入与神经网络的融合 31
2.3.3 神奇的注意力机制 32
2.3.4 像素级Query-Key-Value机制详解 35
2.4 大语言模型：数学的韵律，文本的乐章 41
2.4.1 从神经网络到大语言模型的演进 41
2.4.2 大语言模型的概念 43
2.4.3 大语言模型的架构和特点 44

第3章深入理解Transformer核心 45
3.1 Transformer模型剖析：揭示内核机制 46
3.1.1 Transformer模型概述 46
3.1.2 引入编码器与解码器 48
3.2 编码器：文本信息的变换引擎 52
3.2.1 词嵌入和位置编码 53
3.2.2 自注意力机制和多头注意力机制 54
3.2.3 前馈神经网络层和残差连接 59
3.2.4 Dropout正则化机制 63
3.3 编码器+解码器：信息传递与生成的精华 67
3.3.1 交叉注意力机制和输出分布计算 67
3.3.2 掩蔽处理和序列生成 68
3.4 解码器:文本生成的要诀 69
3.4.1 省略交叉注意力机制 69
3.4.2 自回归生成任务的应用 71
3.5 像素级Transformer详解：中译英为例 71

第4章大语言模型技术精要 81
4.1 文本解析：语言预测之道探索 82
4.1.1 文字预测的基本原理 82
4.1.2 文字预测的学习过程 84
4.1.3 大模型中的文本预测应用 85
4.2 GPT：文本生成的灵魂 86
4.2.1 输入数据的表示方法 86
4.2.2 预训练策略和技术 87
4.2.3 微调方法和应用 89
4.2.4 GPT代码实践：文本生成 92
4.3 BERT ﹒RoBERTa：文本编码的新思路 93
4.3.1 输入数据的表示方法 94
4.3.2 预训练策略和技术 96
4.3.3 微调方法和应用 98
4.3.4 BERT代码实践：文本填空 99
4.4 T5：融合之美 ,文本转换的全新范式 100
4.4.1 输入数据的表示方法 101
4.4.2 预训练策略和技术 102
4.4.3 微调方法和应用 103
4.4.4 T5代码实践：摘要生成 104
4.5 跨语言模型：多语言处理的新前沿 105
4.5.1 跨语言模型的优势和特点 105
4.5.2 跨语言模型挑战与策略 105
4.5.3 多语言模型在实践中的应用案例 106
4.6 语言文字处理：微观视角的文本挖掘 107
4.6.1 字节对编码技术和实践 107
4.6.2 WordPiece方法探索和应用 110
4.6.3 中文文字的处理策略 111
4.6.4 中文文字处理的前沿探索 112
4.7 大语言模型的蜕变：技术演进与前瞻展望 113
4.7.1 模型的提示控制技术 114
4.7.2 对准技术的重要性 121
4.7.3 指令微调 122
4.7.4 ChatGPT与RLHF 124
4.7.5 DeepSeek 126

第5章大语言模型系统开发构建 129
5.1 Hugging Face基础：驾驭Transformers 130
5.1.1 Hugging Face介绍 130
5.1.2 访问模型的方式 131
5.1.3 用Transformers访问模型 132
5.2 中文基准测试：窥探性能 143
5.2.1 数据集组成与构建方法 143
5.2.2 大模型性能评估指标 144
5.2.3 CLUE任务与数据集简介 144
5.3 实现情感分析模型：探索情感世界的大门 146
5.3.1 环境搭建与数据准备 146
5.3.2 数据探索性分析 149
5.3.3 数据预处理 154
5.3.4 模型训练与评估 158
5.3.5 Early Stopping机制 166
5.4 情感分析模型的微调分析：情感的微妙之处 167
5.4.1 查看模型预测的结果 167
5.4.2 总体趋势可视化分析 169
5.4.3 分析模型预测出错倾向 171
5.5 指令微调策略：Instructing Tuning 173
5.5.1 学习数据的获取 173
5.5.2 创建学习数据 174
5.5.3 执行指令微调 175
5.5.4 语句生成 177
5.6 发挥硬件极限的微调：策略与技巧 178
5.6.1 AMP深

前言/序言

在人类文明的漫漫长河中，语言始终是连接思维与现实的桥梁。从甲骨文到二进制代码，从结绳记事到云端对话，语言的形式不断演变，而其承载的智慧却始终如星辰般璀璨。今天，当大语言模型以“数字诗人”的姿态叩响时代之门，我们不禁要问：这场由算法驱动的语言革命，究竟会将人类引向何方？
语言的觉醒：从符号到智能的跨越
大语言模型的崛起，绝非偶然的技术狂欢，而是人类对语言本质探索的必然产物。从图灵测试的构想到Transformer架构的突破，从词嵌入的数学之美到注意力机制的诗意灵感，科学家们用代码重构了语言的神经脉络。这些模型不再满足于简单的“翻译”或“分类”，而是试图捕捉语言中隐含的逻辑、情感与创造力——正如人类幼童通过观察世界学习语言，大模型也在海量文本中构建着对世界的认知图景。
技术背后的温度：算法与人文的对话
当我们惊叹于GPT-4生成流畅诗歌的能力时，或许更应思考：这些“数字缪斯”是否真正理解了“月是故乡明”的意境？大语言模型的工作原理，本质上是将人类语言的概率分布转化为可计算的数学模型，但其中蕴含的，却是人类对语言本质的深刻洞察。从词嵌入到自注意力机制，从预训练到微调，每一步技术突破都在试图弥合“计算”与“理解”之间的鸿沟。而这场探索的终极目标，或许并非复制人类智能，而是创造一种全新的“语言智能”，让机器与人类在对话中彼此照亮。
从实验室到生活：大模型的“破圈”之路
今日的大语言模型，已不再是科研论文中的抽象概念，而是悄然渗透进日常生活的每个角落。从智能客服的温柔应答，到代码生成的精准高效；从新闻摘要的自动生成，到教育领域的个性化辅导，这些模型正在重新定义“生产力”的边界。但技术的价值，终需回归人的尺度：如何让大模型成为人类创造力的延伸，而非替代？如何确保算法的公平性，避免“数字鸿沟”的加剧？这些问题，需要技术专家与人文思考者的共同回答。
未来的对话：人与机器的共生之旅
站在大语言模型的浪潮之巅，我们既无需神化技术的力量，也不应恐惧其带来的变革。正如印刷术的发明未让诗人失业，互联网的普及未让思想消亡，大语言模型终将成为人类智慧的“放大器”。在本书中，我们将以“解构者”的姿态，揭开Transformer架构的神秘面纱；以“实践者”的视角，亲历从情感分析到跨语言处理的完整流程；更以“思考者”的深度，探讨技术伦理与未来图景。
本书全面阐述从人类语言起源到人工智能大模型的技术演进，系统解析了Transformer架构及GPT、BERT、T5等前沿模型的核心原理。内容涵盖语言智能理论基础、大模型关键技术（注意力机制、词嵌入、预训练方法）及实战应用（情感分析、文本生成、问答系统等），特别注重中文场景下的模型优化与实践案例。书中既有对语言本质与AI关系的深度思考，又包含可操作的代码示例和性能优化技巧，兼具学术价值与工程指导意义。本书通过绘画带动技术的讲解，加快读者对知识的理解。本书既强调“工程”，又结合“艺术”。书中将晦涩的数学公式、技术原理等内容巧妙地生活化、趣味化，又以不失严谨的图文形式展现出来。本书采用原创手绘，国画与漫画风格兼顾，内容讲解生活化且不失严谨，并赋予哲学内涵，精选案例，紧跟时代步伐。另外，为便于读者实践，书中所有源代码均可从图书资源中获取。
愿这本书成为您探索大语言模型世界的引航灯。在这里，您将遇见数学的严谨与语言的诗意，触摸代码的冰冷与创造的炽热。因为最终，我们探讨的不仅是技术，更是人类如何通过语言，与机器、与世界、与自己展开一场永恒的对话。

著者
2025年6月

展开收起

大模型技术与构建:从入门到实战:插画版

内容简介

目录

前言/序言

相关书籍

跟我学Python四级教学辅导(全国高等学校计算机教育研究会PAAT考试推荐教材)/青少年人工智

跟我学Python三级教学辅导(全国高等学校计算机教育研究会PAAT考试推荐教材)/青少年人工智

基于人工免疫系统的群体智能算法及其对组合优化问题的研究

设计原本:计算机科学巨匠Frederick P. Brooks的反思

龙芯之光：自主可控处理器设计解析微处理器设计 LoongArch教程书籍芯片工程师集成电路异步图书出品

systemverilog验证

单片机C语言程序设计实训100例：基于AVR+Proteus仿真

O'Reilly：Head First设计模式（中文版）

HTML+CSS网页设计与布局从入门到精通（附CD光盘1张）（数艺设出品）

设计师精通系列：精通JavaScript+jQuery（附1张光盘）（数艺设出品）

推荐书籍

股市趋势技术分析原书第11版

卓有成效的管理者 55周年新译本彼得·德鲁克著“现代管理学之父”写给每个人的自我发展指南

心动的信号7彭高&翁清雅同款果麦经典：悉达多（黑塞代表作）小说

晚熟的人莫言新书朗读者第三期朗读书诺贝尔文学奖获奖作者从红高粱到晚熟的人从历史深处到当下现实现当代文学小说

帝国的崩裂：细说五代十国史（全二册）( 樊登读书推荐! 在乱世中读懂古代中国，从分合中汲取历史教训！）

日本蜡烛图技术：古老东方投资术的现代指南丁圣元译揭示股市k线奥秘史蒂夫尼森著古老东方投资术金融投资理财

我与地坛（2018修订版）史铁生散文集代表作现当代文学随笔中国现当代文学随笔小说畅销书我在岛屿读书节目推荐

皮囊电影浪浪人生原著黄渤、范丞丞主演新增收录10年新版后记典藏版精装蔡崇达新书人民文学出版社

也是冬天，也是春天（迟子建散文力作升级彩插版）

史铁生病隙碎笔（2021纪念版史铁生充满灵性光辉的生命笔记，启迪无数读者的长篇哲思散文经典）中南传媒