内容简介
《AIAgent开发:零基础构建复合智能体》聚焦于基于大语言模型(LLM)构建智能体系统的全面解析。内容包括:LLM的核心原理、Agent的内部架构组成、LangChain与LangGraph框架、RAG检索增强生成机制、MCP上下文通信协议、A2A多智能体协作协议以及扣子低代码平台等一系列关键技术要点。书中配备了大量翔实的案例与实战项目,引领读者逐步精通从模型调用直至系统集成的全流程操作,并详细阐释如何将诸如Qwen3.0、DeepSeek-V1这类通用语言模型与外部工具进行深度整合,从而打造出拥有记忆功能、自主推理能力、任务分解技巧以及多轮交互特性的先进智能体系统。此外,《AIAgent开发:零基础构建复合智能体》还贴心提供了配套的教学视频和示例源码,助力读者更加高效地学习本书知识。《AIAgent开发:零基础构建复合智能体》兼具内容的深入浅出、案例的丰富多元以及技术的前沿先进性,无论是渴望踏入LLM应用开发领域的初学者,还是致力于探索Agent开发的工程实践者,亦或是负责搭建企业AI平台的技术负责人,都能从中受益。
目录
目 录
第 1 章 大模型与智能体技术基础 1
1.1 智能体发展的技术背景 1
1.1.1 从专家系统到语言模型 1
1.1.2 感知?认知?执行 5
1.1.3 智能体的系统级结构模型 7
1.2 大模型的基本架构 9
1.2.1 Transformer结构剖析 10
1.2.2 编码器与解码器机制 13
1.2.3 注意力机制与多头注意力 15
1.2.4 位置编码与上下文建模 17
1.3 大模型能力边界与应用接口 20
1.3.1 通用能力与推理能力 20
1.3.2 输入长度限制与窗口控制 21
1.3.3 提示词工程 23
1.3.4 多模态模型 26
1.4 构建语言智能体的基本流程 29
1.4.1 任务建模与输入输出结构定义 29
1.4.2 大模型API设计模式 32
1.4.3 基于上下文的行为规划设计 33
1.5 本章小结 34
第 2 章 智能体系统的组成结构与运行机制 35
2.1 智能体核心模块构成 35
2.1.1 感知模块:输入理解与解析 35
2.1.2 决策模块:推理与规划逻辑 37
2.1.3 行动模块:工具执行与响应 38
2.1.4 记忆模块:上下文与持久状态 40
2.2 智能体生命周期管理 41
2.2.1 启动与初始化过程 41
2.2.2 对话状态追踪机制 44
2.2.3 中断恢复与持久化上下文机制 48
2.2.4 智能体注销与资源释放机制 52
2.3 与外部系统的集成方式 55
2.3.1 调用Web API与插件机制 56
2.3.2 与数据库系统的读写操作 59
2.3.3 文件系统与代码执行环境 62
2.3.4 UI输入输出的中间层接口 64
2.4 本章小结 67
第 3 章 大模型开发基础 68
3.1 模型服务部署架构 68
3.1.1 OpenAI式SaaS调用方式 68
3.1.2 本地部署Qwen 3.0模型流程 72
3.1.3 模型微调与LoRA注入机制 74
3.1.4 GPU资源调度与推理优化 76
3.2 API调用设计模式 79
3.2.1 Chat Completion API设计 79
3.2.2 函数调用标准结构 82
3.2.3 批处理与流式传输机制 85
3.3 安全与内容控制机制 88
3.3.1 敏感词过滤与红线审查 88
3.3.2 输出可信度评估机制 91
3.4 本章小结 94
第 4 章 LangChain框架与智能体构建流程 95
4.1 LangChain的核心组件 95
4.1.1 LLM接口抽象结构 95
4.1.2 Chains链式逻辑构造器 97
4.1.3 Tools与Agent集成机制 99
4.1.4 Memory记忆管理模块 101
4.2 工具集成与函数调用机制 103
4.2.1 工具函数包装规范 103
4.2.2 Tool执行环境与沙盒控制 104
4.2.3 多工具调用顺序管理 106
4.3 LangChain Agent运行机制 108
4.3.1 ReAct智能体结构 108
4.3.2 自定义提示词驱动智能体 109
4.3.3 工具链动态规划逻辑 111
4.4 本章小结 113
第 5 章 LangGraph智能体编排与任务流管理 114
5.1 LangGraph概述 114
5.1.1 从LangChain到LangGraph 114
5.1.2 LangGraph在智能体体系中的定位 115
5.1.3 面向复杂任务的图式化编排需求 118
5.2 LangGraph的核心概念与结构 119
5.2.1 节点与边的定义 119
5.2.2 状态与上下文存储机制 121
5.2.3 任务依赖与执行路径 122
5.3 LangGraph与LangChain的互补关系 123
5.3.1 链式调用与图式编排的差异 123
5.3.2 与LangChain工具链的集成方式 123
5.3.3 在复杂Agent系统中的联合使用 125
5.4 LangGraph工程化实战 125
5.4.1 LangGraph安装与运行环境准备 126
5.4.2 基于LangGraph的简单任务流示例 127
5.4.3 面向科研助手的多步骤任务实现 129
5.4.4 结合外部工具与数据库的集成案例 131
5.5 LangGraph与协议层的衔接 133
5.5.1 与MCP的接口映射 133
5.5.2 与A2A(多Agent通信协议)的结合 136
5.5.3 面向大规模Agent网络的扩展性设计 138
5.6 本章小结 142
第 6 章 RAG机制:检索增强智能体 143
6.1 RAG原理与系统架构 143
6.1.1 检索-生成双阶段框架 143
6.1.2 向量数据库的嵌入机制 145
6.1.3 文档切片与Chunking策略 146
6.1.4 基于语义相关度的召回机制 148
6.2 文档预处理与向量化 149
6.2.1 文本清洗与句元切分 149
6.2.2 Embedding模型选择 151
6.2.3 Faiss/Weaviate/Chroma部署 154
6.3 基于LangChain的RAG实现 157
6.3.1 RetrievalQA链路构建 157
6.3.2 多段检索与Top-K融合 161
6.3.3 文本与结构化数据混合检索 164
6.4 本章小结 167
第 7 章 MCP协议:模型上下文通信标准 168
7.1 MCP协议基础设计理念 168
7.1.1 模型上下文管理的核心难题 168
7.1.2 上下文段结构化表示 170
7.1.3 系统提示、记忆段、工具段定义 173
7.2 上下文标注与路由机制 176
7.2.1 metadata标签语义结构 177
7.2.2 信息路由控制策略 178
7.2.3 
                                                    
前言/序言
前 言
在人工智能发展的最新浪潮中,大语言模型(Large Language Model,LLM),以下简称为大模型,已成为通用智能迈向实用化与产业化的关键基石。随着Transformer架构的成熟、算力资源的快速提升以及数据训练范式的不断演进,LLM的应用早已突破传统的问答与对话任务,深入拓展到复杂任务执行、流程控制、工具调用与自主决策等高阶能力的实现之中。
在这一技术背景与需求趋势的交汇点上,智能体系统应运而生。它将LLM的理解与生成能力延展为“感知?认知?执行”一体化的任务执行框架,代表了当前人工智能系统进化的核心方向和未来发展范式。
本书旨在全面系统地讲解如何基于LLM构建智能体系统,聚焦从理论原理到工程实战的全链路技术栈。本书共分13章,涵盖LLM技术基础、Agent核心模块、LangChain框架、LangGraph框架、检索增强生成机制(RAG)、上下文协议(MCP)、多Agent通信(A2A协议)、扣子低代码平台等关键模块,各章内容概要介绍如下:
第1章从技术演进的视角出发,介绍从专家系统到模型的发展脉络,并剖析智能体系统中的“感知?认知?执行”链条。
第2章详细拆解智能体的核心模块构成与生命周期管理机制,深入解析感知模块、推理规划模块、行动执行模块和记忆系统的协同工作原理。
第3章则聚焦LLM的服务部署与调用方式,详述SaaS与本地模型的部署流程、微调机制、LoRA注入与推理优化策略,为模型落地提供完整技术支持。
第4章介绍LangChain核心组件(LLM接口、Chains、Tools集成、Memory管理)及工具集成、Agent运行机制,涵盖链式逻辑、自定义提示词和动态规划。
第5章聚焦LangGraph编排与任务流管理,探讨其核心概念、与LangChain互补关系、工程化实战案例及与协议层衔接,助力复杂任务处理。
第6章阐述RAG机制原理、文档预处理与向量化,以及基于LangChain的RAG实现,提升智能体检索与生成能力,优化信息处理效率。
第7章系统阐述MCP(Model Context Protocol)协议,提出模型上下文段的结构化表示方法,引入系统提示、工具段、记忆段等组件,实现上下文语义标注、路由控制与动态合并,为多轮对话与任务连续性提供基础支撑。
第8、9章以实践为导向,讲解如何构建具备记忆管理与工具调用能力的单智能体系统,并进一步扩展为支持任务拆分、状态同步、消息调度的多Agent系统。
第10章介绍A2A(Agent-to-Agent)通信协议,定义Agent之间的语义协商语言与消息格式,支持请求?响应、广播?订阅、协商?竞争等多种调度模式,为多智能体系统的信息流转与行为协同提供语义基础。
第11章面向低代码场景,介绍如何利用扣子平台以可视化流程图与自然语言方式快速搭建可用的智能体应用,显著降低Agent系统的开发门槛。
第12、13章结合系统部署、安全加固、性能优化、并发处理与用户交互测试等实际工程问题,展示了一个可部署、可维护、可扩展的智能体系统从“技术原型”走向“产品落地”的完整工程闭环。同时,结合Qwen 3.0与DeepSeek-V1等主流开源模型,深入解析如何进行模型接入、RAG融合、多Agent协作与应用上线,形成一套兼顾工程可行性与产业实战性的开发路径。
本书内容深入浅出、结构严谨、案例翔实,适合希望入门LLM应用开发的初学者、探索Agent开发的工程实践者、构建企业AI平台的技术负责人,也适合作为AI教学或智能体开发团队的技术培训参考书。
期待本书能够帮助读者构建一个完整的智能体系统知识体系,掌握大模型落地与Agent应用开发的关键能力,在新时代的AI浪潮中勇立潮头、实现突破。
本书资源下载
为方便读者使用本书,本书还提供了教学视频与示例源码。教学视频以二维码的形式放在书中对应各章节中,读者在学习过程中,可直接扫码观看。本书所提供的示例源码,可扫描以下二维码下载:
另外,本书还提供了一个LLM应用开发相关环境的配置指南,以PDF的文件形式放在压缩包中。读者在LLM应用开发过程中,遇到环境配置问题,可以参考该指南解决。
如果读者在学习本书的过程中遇到问题,可以发送电子邮件至booksaga@126.com,邮件主题为“AI Agent开发:零基础构建复合智能体”。
著 者
2025年7月
                      

                   


















