T
traeai
登录
返回首页
Hugging Face视频

什么是张量?

7.5Score
可直接观看的视频资源打开原视频

TL;DR · AI 摘要

张量是机器学习模型处理数据的基础结构,它将文本、图像、音频等现实世界输入转换为数字矩阵进行计算,最终输出有用结果。张量本质上是按形状组织的数字,包括标量(0D)、向量(1D)、矩阵(2D)和高维数组。

核心要点

  • 张量是机器学习模型处理数据的核心结构,用于表示标量、向量、矩阵和高维数组。
  • 文本通过分词和ID映射转换为张量,图像转为像素张量,音频转为数值样本或特征张量。
  • 模型推理过程在张量之间进行矩阵乘法、加法和激活操作,最后通过后处理将输出张量还原为可理解的结果。

结构提纲

按章节快速跳转。

  1. 机器学习模型不直接理解文本、图像或音频,而是通过数字进行运算。

  2. 张量是按形状组织的数字,包括标量、向量、矩阵和高维数组。

  3. 现实世界输入如文本、图像、音频被转换为张量以供模型处理。

  4. 文本转为token ID,图像转为像素张量,音频转为数值样本或特征。

  5. 模型在张量间执行数学运算,输出再经后处理转化为可用结果。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • What Are Tensors?
    • Definition
      • Numbers organized by shape
      • Scalar (0D), Vector (1D), Matrix (2D), Higher Dims
    • Data Conversion
      • Text → Tokens & Token IDs
      • Image → Pixel Tensors
      • Audio → Numerical Samples/Features
    • Model Inference
      • Matrix Multiplication
      • Addition & Activations
      • Tensors as Core Data Structure
    • Post-Processing
      • Output Tensors → Useful Results

金句 / Highlights

值得收藏与分享的关键句。

#张量#机器学习#深度学习#数据处理#Transformers.js

AI 可能会生成不准确的信息,请核实重要内容

什么是张量? | Hugging Face | traeai