learn_pytorch
安装
PyTorch 在 PyPI 上的包名是
torch,而不是 pytorch
1 | # 仅安装 CPU 版本 |
安装 GPU 版本的 PyTorch 需要指定 CUDA 版本的索引。
1 | # CUDA 12.1 版本(推荐,适用于较新的显卡) |
检查你的 NVIDIA 驱动支持的 CUDA 版本:
1 | nvidia-smi |
如何知道对应的cuda版本索引
访问 PyTorch 官网: https://pytorch.org/get-started/locally/
torchvision 和 torchaudio 是 PyTorch 生态系统中的两个官方扩展库:
torchvision - 计算机视觉工具包:
- 预训练模型(ResNet、VGG、YOLO 等)
- 图像数据集(CIFAR-10、ImageNet、COCO 等)
- 图像转换和增强功能
- 图像读取和处理工具
torchaudio - 音频处理工具包:
- 音频数据集
- 音频转换和预处理
- 音频特征提取(MFCC、梅尔频谱等)
- 音频读取和保存
张量与向量
1 | from torch import nn |
1 | OrderedDict([('weight', |
linear = nn.Linear(5, 3)
创建了一个线性层(全连接层):
参数含义: - 5 - 输入特征数(in_features) - 3 - 输出特征数(out_features)
内部结构: 这个层包含两个可学习的参数: - 权重矩阵 W:形状为 (3, 5) - 偏置向量 b:形状为 (3,)
数学运算: y = xWT + b
'weight' (权重) —— 这是 2阶张量 (矩阵),是一个形状
(Shape) 为 3 × 5
的矩阵。