Hugging Face视频
什么是张量?
7.5Score
可直接观看的视频资源打开原视频
TL;DR · AI 摘要
张量是机器学习模型处理数据的基础结构,它将文本、图像、音频等现实世界输入转换为数字矩阵进行计算,最终输出有用结果。张量本质上是按形状组织的数字,包括标量(0D)、向量(1D)、矩阵(2D)和高维数组。
核心要点
- 张量是机器学习模型处理数据的核心结构,用于表示标量、向量、矩阵和高维数组。
- 文本通过分词和ID映射转换为张量,图像转为像素张量,音频转为数值样本或特征张量。
- 模型推理过程在张量之间进行矩阵乘法、加法和激活操作,最后通过后处理将输出张量还原为可理解的结果。
结构提纲
按章节快速跳转。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- What Are Tensors?
- Definition
- Numbers organized by shape
- Scalar (0D), Vector (1D), Matrix (2D), Higher Dims
- Data Conversion
- Text → Tokens & Token IDs
- Image → Pixel Tensors
- Audio → Numerical Samples/Features
- Model Inference
- Matrix Multiplication
- Addition & Activations
- Tensors as Core Data Structure
- Post-Processing
- Output Tensors → Useful Results
金句 / Highlights
值得收藏与分享的关键句。
张量只是按形状组织的数字。
文本变为标记和标记ID;图像变为像素张量;音频变为数值样本或特征。
现实世界数据输入,张量通过模型,有用结果输出。
#张量#机器学习#深度学习#数据处理#Transformers.js