PyTorch实战指南：从零开始掌握张量操作

张开发

• 2026/6/12 14:03:42 • 15 分钟阅读

分享文章

1. 张量基础理解深度学习中的多维数组第一次接触张量这个概念时我完全被各种数学定义搞晕了。后来在实际项目中才发现理解张量其实可以很简单。张量本质上就是多维数组就像Excel表格是二维的张量则把这个概念扩展到了更高维度。举个例子处理一张彩色图片时灰度图是二维张量高度×宽度RGB彩色图是三维张量高度×宽度×3个颜色通道视频数据就是四维张量帧数×高度×宽度×通道PyTorch中的张量有三个关键属性秩Rank表示张量的维度数量。比如向量是1阶张量矩阵是2阶张量形状Shape每个维度的大小比如(3,224,224)表示3通道224×224的图像数据类型dtype指定张量元素的类型如float32、int64等import torch # 创建一个3×3的随机张量 tensor torch.rand(3, 3) print(f形状: {tensor.shape}) # 输出: torch.Size([3, 3]) print(f维度: {tensor.dim()}) # 输出: 2 print(f数据类型: {tensor.dtype}) # 输出: torch.float32实际项目中我经常用这个技巧快速检查张量结构。记住这些属性调试代码时会轻松很多。2. PyTorch环境配置与张量创建配置PyTorch环境时新手最容易踩的坑就是版本兼容性问题。我建议直接用官网推荐的稳定版本避免不必要的麻烦。安装命令很简单pip install torch torchvision创建张量有四种常用方法各有特点import numpy as np data [1, 2, 3] # 方法1从Python列表创建 t1 torch.tensor(data) # 方法2从NumPy数组创建内存共享 arr np.array(data) t2 torch.from_numpy(arr) # 方法3特殊初始化 t3 torch.zeros(2, 3) # 全零张量 t4 torch.ones_like(t3) # 与t3形状相同的全1张量 t5 torch.rand(2, 2) # 随机张量我在实际项目中发现torch.tensor()是最安全的创建方式它会复制数据而from_numpy()虽然高效内存共享但修改NumPy数组会影响张量值容易引发难以察觉的bug。3. 张量操作实战技巧3.1 形状操作改变张量结构改变张量形状是深度学习中最常见的操作之一。PyTorch提供了多种方法tensor torch.arange(12) # 0到11的一维张量 # reshape vs view reshaped tensor.reshape(3, 4) # 新形状3×4 viewed tensor.view(3, 4) # 效果类似但要求内存连续 # 压缩/扩展维度 squeezed torch.rand(1, 3, 1, 2).squeeze() # 去掉大小为1的维度 unsqueezed tensor.unsqueeze(0) # 在第0维增加一个维度这里有个实用技巧使用-1自动计算维度大小。比如要把一个16元素的张量变成4×4auto_shape tensor.reshape(4, -1) # -1会自动计算为43.2 索引与切片精准数据访问PyTorch的索引语法和NumPy几乎一致tensor torch.rand(4, 5) # 基本索引 print(tensor[0, 1]) # 第0行第1列元素 # 切片操作 print(tensor[:, 1:3]) # 所有行的1到2列 # 高级索引 indices torch.tensor([0, 2]) print(tensor[indices]) # 获取第0行和第2行我在图像处理项目中经常用这种技巧提取特定通道或区域的数据。4. 张量运算从基础到高级4.1 基本数学运算PyTorch支持所有常见的数学运算a torch.tensor([1, 2, 3]) b torch.tensor([4, 5, 6]) # 四种基本运算 print(a b) # 加法 print(a - b) # 减法 print(a * b) # 元素乘法 print(a / b) # 元素除法 # 广播机制示例 c torch.tensor([[1], [2], [3]]) print(a c) # a的形状(3,)被广播为(3,3)广播机制是PyTorch的强大特性它允许不同形状的张量进行运算。理解广播规则可以避免很多错误。4.2 矩阵运算与线性代数深度学习核心就是矩阵运算这些操作必须掌握mat1 torch.rand(2, 3) mat2 torch.rand(3, 4) # 矩阵乘法 result torch.matmul(mat1, mat2) # 或者使用运算符 # 点积 dot_product torch.dot(a, b) # 转置 transposed mat1.T在实现神经网络时我经常用torch.matmul()代替torch.mm()因为前者更通用能处理不同维度的张量。5. 高效张量操作技巧5.1 内存优化in-place操作训练大模型时内存管理很关键。PyTorch提供了in-place操作来节省内存tensor torch.rand(2, 2) # 普通操作会创建新张量 result tensor 1 # 新内存分配 # in-place操作修改原张量 tensor.add_(1) # 注意下划线后缀但要注意in-place操作会破坏计算图在自动求导时可能导致错误。5.2 GPU加速CUDA张量利用GPU可以大幅加速计算device cuda if torch.cuda.is_available() else cpu # 创建时指定设备 tensor torch.rand(2, 2, devicedevice) # 或者之后转移 tensor tensor.to(device)我在处理大型图像数据集时将数据预处理也放到GPU上整体速度提升了5-8倍。6. 实际应用案例图像处理中的张量操作让我们看一个完整的图像处理例子from torchvision import transforms # 模拟一张3通道224×224的图像 image torch.rand(3, 224, 224) # 数据增强 transform transforms.Compose([ transforms.RandomHorizontalFlip(p0.5), transforms.Normalize(mean[0.5], std[0.5]) ]) # 应用变换 augmented transform(image) # 批量处理 (batch, channel, height, width) batch torch.stack([image, augmented])这个例子展示了如何用张量操作实现常见的数据增强技术。在实际项目中合理使用这些操作可以显著提升模型性能。

更多文章

前端开发 2026/6/12 14:03:07

Firefox安卓版完全指南：打造你的隐私优先移动浏览器

Firefox安卓版完全指南：打造你的隐私优先移动浏览器【免费下载链接】firefox-android :warning: This repository hosts the Firefox for Android (Fenix), Focus for Android, and Mozilla Android Components projects. It is now developed and maintained as p…

逆向工程第一课：30秒用DIE破解二进制文件的“身份密码” 当你第一次拿到一个陌生的可执行文件时，最令人头疼的问题往往是："这玩意儿到底是用什么写的？"作为逆向工程师或安全分析人员，我们每天都要面对各种来…

张开发

前端开发 2026/5/8 6:46:16

Arduino嵌入式重量单位转换库weight深度解析

1. 项目概述weight是一个面向嵌入式平台（特别是 Arduino 生态）的轻量级重量单位转换库，由 Rob Tillaart 开发并持续维护。该库并非仅提供基础的千克-磅换算，而是构建了一个以国际单位制（SI）克（g…

张开发

PyTorch实战指南：从零开始掌握张量操作

最新文章

如何轻松批量下载视频号内容：res-downloader完整指南

高通Camera HAL3实战：从configure_streams到Usecase创建，一次搞懂ZSL拍照背后的完整流程

从天气预报到视频预测：ConvLSTM实战项目入门（附PyTorch完整代码）

别再乱卸载补丁了！Win10共享打印机0x00000709/11b错误，用这个官方修复补丁KB5007253一键搞定

别再只会下载程序了！手把手教你用J-Link的J-Scope和RTT功能做实时数据可视化

mysql如何使用INNER JOIN内连接_mysql等值连接实现方式

推荐文章

相关文章

分享文章

更多文章

Firefox安卓版完全指南：打造你的隐私优先移动浏览器

告别公网IP烦恼：用花生壳+EMQX搭建永久在线的私有MQTT Broker指南

【VRChat 改模】从零到一：手把手配置 VCC、SDK 与 Unity 全流程

释放系统潜能：Win11Debloat工具让电脑性能提升30%的技术解析与应用指南

【Python原生AOT编译落地白皮书】：2026生产环境已验证的5大避坑清单与性能跃迁实测数据

3D模型优化终极指南：glTF Pipeline如何让Web应用加载更快

突破网络性能瓶颈：iperf3 Windows版全方位测试指南

PX4-Autopilot固定翼无人机编队飞行：深度实战与高效部署指南

775批量修改文件只读属性为可读

WSL和LLamaFactory框架微调千问3大模型

逆向分析第一步：用Detect It Easy（DIE）快速识别文件加壳与编程语言（附开源版下载）

Arduino嵌入式重量单位转换库weight深度解析