内容简介
本书从生成式AI的基本概念出发,介绍会话编程、提示词工程和上下文记忆等基本编程技术,展示如何通过函数调用与编程模式提升生成式AI应用程序的开发能力与效率,系统讲解LangChain中间件的使用及智能体(Agent)开发等高级编程技能。此外,本书通过图像、视频和语音的识别与生成实例,阐述了多模态编程的精髓,揭示了多模态编程作为生成式AI编程未来发展方向的重要地位与应用潜力。全书配备丰富的基于智谱AI和DeepSeek的实例和源代码(获取方式见封底),帮助读者快速入门并通过实践掌握生成式AI应用开发的方法与技巧。
本书适合生成式AI应用程序软件设计师、开发人员和技术爱好者阅读,为他们提供生成式AI的基本常识及编程实践指导。
目录
前言
第1章 生成式AI概述
1.1生成式AI简介
1.2生成式AI模型的核心原理概览
1.3代表性生成式AI模型
1.3.1OpenAI
1.3.2百度文心大模型
1.3.3讯飞星火大模型
1.3.4智谱AI大模型
1.3.5DeepSeek
1.4DeepSeek的创新与崛起
1.4.1DeepSeek引领行业变革
1.4.2DeepSeek低成本实现途径
1.5生成式AI应用场景
1.6编程中的关键问题与挑战
1.7本章小结
第2章 会话编程——与生成式AI交互的基本方式
2.1交互式对话编程
2.1.1编程与运行环境准备
2.1.2服务访问环境准备
2.1.3你问AI答——命令行界面交互
2.1.4你问AI答——简单的图形界面交互
2.1.5让AI更快地响应——流式输出
2.2提示词工程
2.2.1持续优化营销文案——迭代式提示词开发
2.2.2循循善诱完成思维题——引导模型思考
2.2.3快速生成商品评价摘要——文本概括
2.2.4阅读理解——文本推断
2.2.5多语全能秘书——文本转换
2.2.6写作助手——文本扩展
2.3让AI具有记忆——保留对话上下文
2.4本章小结
第3章 函数调用——构建生成式AI的神经反射弧
3.1计算定积分——本地函数调用
3.2数据查询助手——数据库访问
3.3天气查询助手——第三方API调用
3.4网络搜索助手——网页搜索
3.5本章小结
第4章 生成式AI应用设计模式——提升生成式AI的推理能力
4.1思维链
4.1.1激发生成式AI潜能——零样本提示
4.1.2生成单元测试用例——少样本提示
4.2思维树
4.2.1结构化写作——基于思维树进行创作
4.2.2红白球分析——基于思维树进行推理
4.3六顶思考帽——蜂巢模式
4.4软件缺陷分析与指派——组合模式
4.5本章小结
第5章 LangChain简介——生成式AI应用开发中间件
5.1生成式AI应用开发中间件概述
5.2模型的输入与输出
5.2.1你问AI答——模型接口封装
5.2.2新闻生成与翻译——提示词模板
5.2.3你问AI答——输出解析
5.3诗歌创作——LangChain表达式语言
5.4内存记忆Memory
5.4.1不会遗忘的记忆——ConversationBufferMemory组件
5.4.2记忆短跑健将——ConversationBufferWindowMemory组件
5.4.3智能会议助手——ConversationEntityMemory组件
5.5文档理解与问答——增强检索生成
5.5.1自然语言向量化
5.5.2文档检索
5.6诗歌创作——回调函数
5.7网络搜索助手——智能体
5.8本章小结
第6章 智能体——生成式AI应用的主流形态
6.1智能体实现概述
6.2智能旅行规划助手——ReAct型智能体
6.2.1主程序
6.2.2提示词
6.2.3工具集
6.2.4运行智能体
6.3多源知识问答——JSON格式聊天智能体
6.4智能旅行规划助手——自定义智能体
6.4.1辅助类实现
6.4.2辅助函数实现
6.4.3Action工具实现
6.4.4智能体主体实现
6.4.5提示词
6.4.6主程序实现及智能体运行
6.5本章小结
第7章 多模态编程——生成式AI的视觉与听觉感知和生成能力
7.1图像、视频与语音识别
7.1.1看图说话——理解图像内容
7.1.2替你刷视频——理解视频内容
7.1.3会议秘书——语音识别
7.2图像、视频与语音生成
7.2.1你说AI画——文生图
7.2.2你说AI演——文生视频
7.2.3朗读助手——语音生成
7.3本章小结
第8章 DeepSeek应用开发
8.1逻辑推理大师——DeepSeek推理模型应用
8.2智能辅助编程插件——DeepSeek的对话、续写及FIM补全
8.2.1VS Code扩展框架
8.2.2解释与重构优化代码
8.2.3智能代码补全
8.2.4打包并安装、使用插件
8.3小说生成器——基于DeepSeek推理模型的工作流
8.3.1小说生成器的工作流
8.3.2封装推理模型交互接口
8.3.3实现生成器工作流
8.4本章小结
前言/序言
人工智能(Artificial Intelligence,AI)对于所有软件架构师和开发人员而言都不陌生,但大多数软件架构师和开发人员却没有真正涉足基于AI的应用程序的设计与实现。AI相对于传统应用程序而言,其在架构与研发方面所需的资源与技术要求更高,所以它不只是非IT人士的门槛,也是众多软件架构师和开发人员的门槛。自OpenAI发布ChatGPT后,不仅令生成式AI(Generative Artificial Intelligence,GenAI)一夜之间火爆全球,而且其提供的生成式AI大语言模型(Large Language Model,LLM)API服务,更是将基于生成式AI的应用程序设计与开发带入了一个新的阶段。而DeepSeek的横空出世,打破了此前大模型对算力资源的极致依赖。这种对算力资源的革命性优化,使得中小规模企业甚至独立开发者能够以极低的基础设施投入获得高水平的AI能力,成功打通了从技术原型验证到规模化商业落地的关键路径。
生成式AI模型在自然语言处理、文本生成、图像和视频生成以及多模态理解方面的突破,不仅让越来越多的人感受到AI的魅力,也大幅拓展了软件开发的边界。开发者们可以更轻松地调用这些模型的强大能力,将其融入各类应用程序中,为用户带来前所未有的交互体验和创新功能。
在这股技术浪潮中,许多企业和开发者都迫切需要掌握利用生成式AI技术进行应用开发的技能。无论是借助模型直接进行文本创作,还是通过扩展模型能力实现知识问答、数据分析、视觉识别、语音合成等功能,生成式AI模型都为软件设计与实现提供了新思路和新范式。同时,大量低门槛API和开源工具的不断涌现,进一步降低了开发者和企业使用生成式AI技术的成本与难度。
在此背景下,我们编写了本书,旨在帮助软件架构师、开发人员以及对生成式AI感兴趣的读者快速掌握基于生成式AI的应用开发。本书从基础概念和应用场景切入,提供了大量真实可运行的示例与实战案例,覆盖与生成式AI开发相关的重要环节,包括对话交互、提示词工程、函数调用、增强检索、编程模式、智能体以及多模态应用等。
全书共8章,主要内容及特色如下:
第1章生成式AI概述:介绍生成式AI的基本概念和核心原理,并梳理其应用场景以及在编程时需要关注的问题与挑战。
第2章会话编程:展示如何在命令行、图形界面等环境中,与生成式AI模型进行实时交互。通过提示词工程实践,帮助读者掌握如何有效地与模型对话,引导其思考并完成文本概括、情感分析、翻译转换等常见任务。
第3章函数调用:介绍如何通过本地函数调用、数据库访问以及第三方API集成等方式,让生成式AI得以结合外部环境发挥更大作用,从而构建各种实用型的应用程序。
第4章生成式AI应用设计模式:深入探讨思维链、思维树、蜂巢模式以及组合模式等常见的生成式AI推理与思维方式,帮助读者举一反三,开发更智能、更灵活的应用程序。
第5章LangChain简介:LangChain作为生成式AI应用开发中间件,具有模型封装、提示词模板、输出解析、内存管理和检索增强等功能,这些特性大幅简化了应用程序的开发过程。本章通过多个示例程序演示如何使用LangChain来快速搭建生成式AI应用。
生成式AI应用开发实战:基于智谱AI与DeepSeek第6章智能体:聚焦生成式AI应用中最核心的智能体概念,探讨如何使用ReAct、Conver-sationalChat等类型的智能体完成旅行规划、知识问答等任务,并展示如何实现自定义智能体。
第7章多模态编程:展现人工智能在视觉、听觉等多模态场景下的强大能力,包括图像内容理解与生成、视频内容理解与生成、语音识别与合成等,使读者在掌握文本处理技能的基础上,进一步解锁多模态的应用能力。
第8章DeepSeek应用开发:基于DeepSeek提供的对话模型、推理模型及其前缀续写、FIM补全等功能实现智能辅助编程、小说生成器等更加贴近实际应用场景的工具,为将技术能力转化为产业价值提供有益的探索和启示。
在阅读本书过程中,读者会发现生成式AI与传统AI技术有着显著不同:一方面,生成式AI模型具有强大的自然语言处理和知识推理能力,开发者可以通过提示词直接进行功能“编程”;另一方面,结合外部工具、函数调用、多模态处理等方式,可以显著拓展生成式AI的应用边界。面对不断涌现的理论与实践进展,希望本书能帮助读者在繁杂的技术生态中厘清脉络,掌握高效、灵活、可扩展的生成式AI应用开发方法,并将其运用到实际项目之中。
本书内容以代码规模简短的实战案例(所有案例均提供源代码文件)为主,力求兼顾新手友好与行业前沿:
对尚未接触过人工智能或机器学习的读者而言,只需具备一定编程基础和对开发流程的基本了解,便可通过本书开启基于生成式AI应用程序的研发之旅。
对已经有一定人工智能基础和项目经验的读者而言,可以把本书作为生成式AI应用开发的实践指南,从中获取灵感,进一步探索智能体、多模态等技术。
对企业团队而言,本书的实践案例可作为内部人才培