Toto 2.0 模型发布:时间序列基础模型的规模定律首次验证

TL;DR · AI 摘要
Datadog 发布 Toto 2.0,首次实现时间序列基础模型的规模定律。
核心要点
- Toto 2.0 参数范围覆盖 4M 到 2.5B,每个版本均超越前代性能。
- 这是首个在时间序列领域验证规模定律的开源模型系列。
- 模型已在 BOOM、GIFT-Eval 和 TIME 等主流基准上取得领先。
结构提纲
按章节快速跳转。
Datadog 推出 Toto 2.0 开源权重,基于 Apache 2.0 协议。
- §模型特性
Toto 2.0 是一个参数跨度从 4M 到 2.5B 的时间序列基础模型家族。
- §性能优势
所有版本均在单一超参配置下超越前代模型。
Toto 2.0 首次在时间序列领域验证了规模定律的有效性。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Toto 2.0 模型发布
- 模型特性
- 参数范围:4M - 2.5B
- 统一超参配置
- 性能表现
- BOOM 基准领先
- GIFT-Eval 表现优异
- TIME 基准领先
- 技术意义
- 验证时间序列规模定律
- 推动模型可扩展性研究
金句 / Highlights
值得收藏与分享的关键句。
Toto 2.0 是首个在时间序列领域验证规模定律的模型系列。
所有模型版本都在 BOOM、GIFT-Eval 和 TIME 上取得领先。
参数从 4M 到 2.5B,每个版本都比前一代更优。
clem 🤗 在 X 上: “缩放定律终于对时间序列基础模型奏效了吗?今天,@datadoghq 在 @huggingface 上以 Apache 2.0 协议发布了 Toto 2.0 的权重。这是一系列开放权重的 TSFM,参数规模从 400 万到 25 亿不等,每个尺寸都基于单一超参数配置超越前一个版本。https://t.co/ISuKEwrfRp” / X
不要错过正在发生的事

clem 
缩放定律终于对时间序列基础模型奏效了吗?今天,
在
上以 Apache 2.0 协议发布了 Toto 2.0 的权重。这是一系列开放权重的 TSFM,参数规模从 400 万到 25 亿不等,每个尺寸都基于单一超参数配置超越前一个版本。在主流基准测试 BOOM、GIFT-Eval 和 TIME 上均处于领先地位。大多数 TSFM 模型系列会发布多个尺寸,但性能大致相同。而这个系列并非如此。其意义在于:缩放定律曾为语言和视觉领域带来了计算量、数据量、参数量与下游任务性能之间可预测的关系。直到现在,时间序列领域也终于拥有了这样的规律。一旦掌握了这一规律,你就可以更有信心地扩展数据和算力,并开始探索在下一个数量级上将涌现出哪些新能力。25 亿参数开源权重:https://huggingface.co/Datadog/Toto-2.0-2.5B… 400 万参数开源权重:https://huggingface.co/Datadog/Toto-2.0-4m… 博客文章:https://datadoghq.com/blog/ai/toto-2/?utm_content=blog&utm_medium=organicsocial…
·
6
21
135
54
阅读 6 条回复