Aravind Srinivas(@AravSrinivas)2026年5月27日

Every millisecond matters. We’re open sourcing the tokenizer we built and deployed on production; th...

8.5Score

Every millisecond matters. We’re open sourcing the tokenizer we built and deployed on production; th...

TL;DR · AI 摘要

Perplexity 开源其高效的 Unigram 分词器，CPU 利用率降低 5-6 倍，显著减少延迟。

核心要点

Perplexity 开源 Unigram 分词器，CPU 利用率降低 5-6 倍。
小重排器和嵌入器在 GPU 上运行时间仅为单-digit 毫秒。
开源分词器有助于提高整体系统效率。

结构提纲

按章节快速跳转。

§引言
Perplexity 开源其高效的 Unigram 分词器。
·分词器性能
Unigram 分词器显著降低 CPU 利用率，提高系统效率。
·技术细节
小重排器和嵌入器在 GPU 上运行时间仅为单-digit 毫秒。
·开源贡献
开源分词器有助于社区和开发者。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Perplexity Unigram 分词器

金句 / Highlights

值得收藏与分享的关键句。

We're open-sourcing the Unigram tokenizer we rebuilt to reduce CPU utilization by 5-6x.
— 正文
⬇︎ 下载 PNG 𝕏 分享到 X
Small rerankers and embedders run in single-digit milliseconds on GPU.
— 正文
⬇︎ 下载 PNG 𝕏 分享到 X
CPU tokenization is a meaningful share of total latency.
— 正文
⬇︎ 下载 PNG 𝕏 分享到 X

#Unigram 分词器#Perplexity#CPU 利用率#分词优化#开源项目

标题: Aravind Srinivas 在 X 上的发言: "每一毫秒都至关重要。我们开源了我们在生产环境中构建并部署的分词器；它的效率远高于 huggingface 和 sentencepiece。" / X

URL 来源: https://x.com/AravSrinivas/status/2059689617314701796

Markdown 内容:

每一毫秒都至关重要。我们开源了我们在生产环境中构建并部署的分词器；它的效率远高于 huggingface 和 sentencepiece。

引用

图片 1: 方形个人资料图片

困惑度

@perplexity_ai

9小时前

我们开源了重新构建的 Unigram 分词器，以减少 5 到 6 倍的 CPU 使用率。小型重排序器和嵌入器在 GPU 上运行时间仅为个位数毫秒，使 CPU 分词成为总延迟的重要部分。github.com/perplexityai/p

图片 2: 图片