内容简介
《PyTorch深度学习与大模型部署及微调》根据大多数软件公司对AI大模型开发程序员的标准要求,结合范例程序,针对零基础人群,讲述了从“入门”到“能干活”所必需掌握的知识点。
《PyTorch深度学习与大模型部署及微调》内容涵盖了深度学习各种模型的知识点,包括Python和Pytorch的开发环境、神经网络预测技术、用卷积和残差神经网络分类图片的技术、数据预处理和数据增强、用生成对抗网络识别图片的技术、用循环神经网络和Transformer 网络分析文本的技术、用VIT模型分类图片的技术、人脸识别和目标物体识别的技术、音频处理技术,以及DeepSeek本地化部署和微调技术等。
目录
第1章 神经网络、深度学习和大模型
1.1?神经网络和深度学习
1.1.1?神经元和神经网络
1.1.2?深度神经网络与深度学习
1.1.3 深度学习的应用场景
1.2 深度学习和大模型
1.3 实现深度学习的Pytorch框架
1.3.1 Pytorch简介
1.3.2 Pytorch的常用模块
1.3.3 搭建Python开发环境
1.3.4 简单安装Pytorch框架
1.4 搭建支持GPU的Pytorch环境
1.4.1 GPU和CUDA
1.4.2 安装基于GPU的Pytorch
1.5 小结和预告
第2章 学习张量,搭建神经网络
2.1 张量的概念和基本操作
2.1.1 标量、向量、矩阵和张量
2.1.2 张量和深度学习的关系
2.1.3 创建张量
2.1.4 张量的常见方法
2.1.5 张量与Numpy数据的相互转换
2.2 张量的常见运算
2.2.1 张量的索引操作
2.2.2 张量的切片操作
2.2.3 转换张量的维度
2.2.4 过滤与条件操作
2.3 搭建第一个神经网络
2.3.1 训练集、验证集和测试集
2.3.2 过拟合与欠拟合
2.3.3 损失函数
2.3.4 神经网络的超参数
2.3.5 搭建神经网络的定式
2.4 小结和预告
第3章 实战神经网络(多层感知机)
3.1 Pytorch自带的数据集
3.1.1 数据集介绍
3.1.2 下载MNIST数据集
3.1.3 可视化MNIST数据集
3.2 激活函数
3.2.1 引入非线性因素的激活函数
3.2.2 sigmoid激活函数
3.2.3 tanh激活函数
3.2.4 ReLU激活函数
3.3 神经网络与损失函数
3.3.1 用MNIST训练,观察损失值
3.3.2 交叉熵损失函数
3.4 优化器与前后向传播
3.4.1 SGD优化器与梯度下降
3.4.2 前向传播与后向传播
3.4.3 SGD引入Momentum参数
3.4.4 Adagrad、RMSprop和Adam优化器
3.5 用神经网络作预测
3.6 小结和预告
第4章 用卷积神经网络识别图片
4.1 下载并使用CIFAR-10数据集
4.1.1 获取CIFAR-10数据集
4.1.2 观察CIFAR-10数据集
4.2 卷积神经网络概述
4.2.1 二维卷积的计算范例
4.2.2 填充和移动步长
4.2.3 卷积通道数值说明
4.2.4 二维卷积方法及其参数
4.2.5 池化层及池化策略
4.2.6 整体结构及工作流程
4.3 用MNIST训练卷积神经网络
4.3.1 搭建模型,观察训练结果
4.3.2 观察模型的结构
4.3.3 用卷积神经网络预测结果
4.4 用CIFAR-10训练卷积神经网络
4.4.1 卷积及池化后的尺寸计算方式
4.4.2 搭建及训练模型
4.4.3 用模型预测图片分类
4.5 小结和预告
第5章 实战残差神经网络
5.1 梯度爆炸和梯度消失
5.1.1 可视化观察梯度下降
5.1.2 后向传播、梯度消失和梯度爆炸
5.1.3 梯度消失和梯度爆炸的解决方法
5.2 搭建残差神经网络
5.2.1 残差模块的结构
5.2.2 搭建残差神经网络的方法
5.3 残差神经网络与图片分类
5.3.1 识别MNIST手写数字体
5.3.2 分类CIFAR-10图片
5.4 小结和预告
第6章 对模型的实用性操作
6.1 可视化模型
6.1.1 用PyTorchViz可视化模型
6.1.2 用TensorboardX可视化模型
6.1.3 用TensorboardX观察训练过程
6.2 保存和加载模型
6.2.1 保存模型
6.2.2 加载模型
6.3 数据预处理和数据增强
6.3.1 归一化处理
6.3.2 图片的随机裁剪
6.3.3 图片的中心裁剪
6.3.4 图片缩放
6.3.5 水平、垂直与随机角度翻转图片
6.3.6 随机灰度化
6.3.7 亮度、对比度、饱和度和色度变换
6.4 小结和预告
第7章 基于深度学习的回归分析和聚类分析
7.1 回归分析
7.1.1 获取California房价数据集
7.1.2 用神经网络分析预测房价
7.1.3 获取股票数据集
7.1.4 用神经网络分析股价
7.2 聚类分析
7.2.1 分类葡萄酒数据
7.2.2 分类鸢尾花数据
7.2.3 用神经网络预测股票涨跌
7.3 小结和预告
第8章 迁移学习实战
8.1 迁移学习的概念和常用方法
8.1.1 迁移学习的两大实现方法
8.1.2 可供使用的预训练模型
8.2 基于微调参数的迁移学习
8.2.1 ResNet18和ResNet34
8.2.2 用数据集训练微调参数
8.3
前言/序言
当下深度学习和大模型是一个技术热点,如果读者想学习这方面的技能,那么本书是一个不错的选择。
从知识体系上来看,本书的内容涵盖了深度学习各种模型的知识点,包括但不限于搭建Python和Pytorch的开发环境、用多层感知机预测数据的技术、用卷积和残差神经网络分类图片的技术、用生成对抗网络识别图片的技术、用循环神经网络和Transformer网络分析文本的技术、用ViT模型分类图片的技术、人脸识别和目标物体识别的技术,以及强化学习和音频分析等技术。
此外,本书还用专门的一章讲述了DeepSeek模型在本地部署和微调的技能点。
本书的作者具有多年Python、AI和大模型的开发经验,谙熟AI模型方面高级开发所需要掌握的知识体系,也非常清楚从零基础升级到高级开发人员可能会走的弯路,所以在本书的内容安排上,第一,只讲初学者有必要学习的知识点,而不会导致过度学习;第二,并没有像其他同类书那样给出复杂的数学公式,而是用通俗的文字讲述各种技能;第三,结合具体范例程序讲述各知识点,从而能确保读者学得会并用得上。
本书的全部范例在CPU环境下也均可运行。本书还附带一些范例所必需的数据集,而且对于所有范例,笔者都是逐行讲述了关键要点。所以笔者相信,即使是零基础的初学者,也能通过本书提供的范例及文字,高效地掌握深度学习的相关技能点。本书的范例程序篇幅适中,通俗易懂,还可作为课程设计或毕业设计的参考范例。
本书赠送代码、数据集、PPT和视频讲解,读者扫描下方二维码可获取。
为了让读者能高效掌握本书的知识点和范例,笔者在编写本书时,处处留心、字字斟酌。本书不会出现复杂的数学公式和术语,而是用比较通俗易懂的文字,由浅入深地讲述诸多知识点。
由于编者水平有限,书中难免存在缺点和错误,殷切希望广大读者批评指正。