内容简介
本书是系统讲解DeepSeek大模型的技术指南,结合数据、信息、知识、智慧、意图白盒测评这一前沿理念,详 细阐述如何在大模型时代实现模型选取、定制优化与多模型协同,从而打造出最适合实际应用需求的智能系统。 本书共12章,分别从大模型时代的来临、DeepSeek的核心技术与创新突破、DIKWP白盒测评理念详解、模型 择优、大模型优化方法与实践指南、DeepSeek实战优化策略、大模型的协同与互补、DeepSeek与国内外主要大模型 及其AI智能体的对比分析、行业应用案例分析等方面进行阐述,帮助读者深入理解DeepSeek的工作机制,并掌握其 在大规模预训练、推理优化及应用部署中的关键技术。 本书旨在为广大人工智能爱好者、技术开发者和企业决策者提供一部既具理论深度又通俗易懂的指导手册,也 适合作为大、中专院校人工智能相关专业的教学参考书。
目录
引言:
大模型时代的来临
1.1 智能涌现的契机 002
1.1.1 初创与技术探索 002
1.1.2 用户热情与需求激增 004
1.1.3 社会变革与产业升级 005
1.1.4 国际竞争与技术自主 006
1.2 DeepSeek 横空出世 006
1.2.1 起源与发展历程 006
1.2.2 低成本高性能的技术秘密 007
1.2.3 国际影响与市场震荡 007
1.2.4 案例解读与未来展望 008
1.3 为什么需要新理念 008
1.3.1 黑盒测评的局限 009
1.3.2 白盒测评的提出与意义 009
1.3.3 白盒测评的实践意义 009
1.3.4 白盒测评在行业应用中的潜力 010
1.4 总结 010
DeepSeek解析:
核心技术与创新突破
2.1 DeepSeek 的发展路径 012
2.1.1 初创与技术探索 012
2.1.2 里程碑事件:发布DeepSeek-V3 版本 013
2.1.3 专用模型的推出:DeepSeek-R1 015
2.2 模型架构与规模 016
2.2.1 混合专家(MoE)架构解析 016
2.2.2 参数规模与计算效率 017
2.2.3 内部机制剖析 018
2.3 突破性能瓶颈 020
2.3.1 低成本硬件的高效利用 020
2.3.2 英伟达H800 GPU的运用与成本 控制 020
2.3.3 模型蒸馏技术的应用 021
2.4 性能对比与评价 022
2.4.1 权威测评指标 022
2.4.2 DeepSeek与国内外顶尖模型的 对比 023
2.5.1 开源策略的优势 026
2.5.2 插件生态与交流合作 027
2.5.3 开源对企业应用的推动作用 027
2.6 总结 028
DIKWP 白盒测评理念详解
3.1 黑盒测评与白盒测评:从结果到过程的 转变 030
3.1.1 传统黑盒测评的定义与局限 030
3.2.1 数据层(Data):感知与原始信息的 获取 032
3.2.2 信息层(Information):信息提取与 初步处理 034
3.2.3 知识层(Knowledge):信息组织与 系统构建 035
3.2.4 智慧层(Wisdom):高层次推理与 问题解决 037
3.2.5 意图层(Purpose):目标识别与 行为调控 038
3.3 DIKWP 测评体系的设计与实施 040
3.3.1 测评设计理念与目标 040
3.3.2 四大模块详细设计 041
3.3.3 测评流程与标准 051
3.4 测评结果分析:各大模型在 DIKWP 体系下 的表现 052
3.4.1 感知与信息处理模块测试 052
3.4.2 知识体系构建与推理模块测评 054
3.4.3 智慧应用与问题解决模块测评 055
3.4.4 意图识别与行为调整模块测评 057
3.4.5 测评结论与行业启示 058
3.5 意义与未来展望:从“会想”到“会行动” 的新纪元 059
3.5.1 为研究者与开发者带来的全新 视角 059
3.5.2 引领人工智能迈向“自觉”时代 059
3.5.3 多模型协同与定制化优化的新 方向 059
3.5.4 未来展望:从“会想”到 “会行动”060
3.6 总结 060
模型择优:
如何选择合适的大模型
4.1 明确任务需求 062
4.1.1 任务场景及核心需求 062
4.1.2 结合DIKWP框架分析需求侧 重点 064
4.2 对比模型强项与弱项 065
4.2.1 市场主流模型对比概述 065
4.2.2 最新测评数据支撑 065
4.3 模型选择策略 066
4.3.1 分步选型流程 067
4.3.2 选型策略示例 069
4.3.3 多模型共存与组合策略 071
4.3.4 成本、安全与数据隐私考量 073
4.4 开源 vs 封闭:选型中的多维度比较 074
4.4.1 开源模型的详细优劣分析 074
4.4.2 封闭模型的详细优劣分析 075
4.4.3 给企业决策者的选型建议 076
4.5 成本、安全与长期优化的综合考量 076
4.5.1 成本评估 076
4.5.2 数据安全与隐私保护 077
4.5.3 技术生态与未来优化 078
4.6 综合决策与实践建议 078
4.6.1 决策流程解析 078
4.6.2 实践建议 078
4.7 未来趋势与展望 079
4.7.1 模型轻量化与垂直化 080
4.7.2 多模型协同与智能调度 080
4.7.3 数据安全与隐私保护的不断升级 080
4.7.4 成本与资源利用的最优化 080
4.7.5 开源与闭源并存的新生态 081
4.8 总结 081
大模型定制:
优化方法与实践指南
5.1 为何要定制 084
5.1.1 行业与企业需求的多样性 084
5.1.2 定制化的意义与价值 085
5.2 微调 085
5.2.1 微调的基本概念 085
5.2.2 微调的整体流程 086
5.2.3 微调的最佳实践 088
5.2.4 微调过程中的常见问题及解决 方案 089
5.3 提示工程 090
5.3.1 提示工程的基本原理 090
5.3.2 提示工程的策略与技巧 090
玩透 DeepSeek
认知解构 + 技术解析 + 实践落地
5.3.3 提示工程的实际案例 09
前言/序言
站在人类文明史的转折点,我们正见证一场前所未有的智能革命。从AlphaGo的
惊艳亮相到ChatGPT的全民狂欢,人工智能技术以令人惊叹的速度重塑着人类社会
的认知边界。在这场波澜壮阔的技术变革中,大语言模型无疑是最具代表性的突破之
一——它不仅是算法与算力的结晶,更是人类探索智能本质的里程碑。
本书的写作源于一个根本性矛盾:当大模型参数规模突破万亿量级,当AI生成内
容开始渗透教育、医疗、法律、行政管理等专业领域时,传统“黑盒式”技术评估体
系已无法满足社会对可信AI的迫切需求。我们深刻认识到,单纯关注输出结果的测评
方法,就像仅凭考试成绩评判学生能力,往往会导致对机器智能认知的系统性偏差。
正是这种反思,催生了数据—信息—知识—智慧—意图(Data-Information-Knowledge
Wisdom-Purpose,DIKWP)白盒测评体系——这套方法论不仅解构了机器认知的底层
逻辑,更为大模型技术的健康发展提供了评估基准。
在技术演进图谱中,DeepSeek横空出世具有特殊意义。这个来自中国的AI模型,
以“在千亿参数规模中实现最优成本效能比”的突破性表现,打破了“算力霸权决定
技术霸权”的固有认知。其混合专家架构与动态稀疏激活机制的创新设计,为全球大
模型发展提供了全新范式。我们选择DeepSeek作为技术载体,不仅因其代表了中国
AI研究的最高水平,更因它在模型透明度与可解释性方面的持续探索,与DIKWP理
念形成了完美共振。
本书面向以下读者:技术开发者将获得从模型微调到多模态协同的完整工具链;
企业决策者可掌握价值千万的AI选型评估框架;哲学爱好者则能透过技术表象,思考
意识本质的终极命题;普通读者可以通过本书了解最新人工智能技术的发展脉络,以
及其对人类社会发生的深刻影响。我们刻意摒弃艰深公式,代之以300+可视化图表和
可复现的代码案例,力求在学术严谨性与实践指导性间找到最佳平衡点。
在此,特别感谢DIKWP人工意识国际团队的贡献,团队人员有海南大学的郭振东、
弓世明、吴坤光、唐福亮、王玉星、黄帅帅、褚泽世、华若宇、杨爱单妮、靳东鹏、
王卓然、朱厚宏等。他们在章节撰写、内容修订、文献校对及出版过程中倾注了宝贵
心血。同时,由衷感谢北京大学出版社的专业支持,正是跨学科协作,使本书在内容
架构、知识呈现与数字衍生品开发上均树立了行业标杆。
智能时代的黎明已然到来,但朝阳的方向由我们共同决定。翻开这本书,您将获
得的不仅是驾驭大模型的技术密钥,更是参与塑造人类文明新形态的入场券。让我们
携手穿越技术的迷雾,在机器智能的璀璨星河中,找寻属于人类的认知坐标。
段玉聪 朱绵茂 梅映天 庞兴梅