最聪明的AI团队正在超越聊天机器人

Gradient Flow

Gradient Flow2026年6月2日

最聪明的AI团队正在超越聊天机器人

8.5Score

TL;DR · AI 摘要

企业AI正从聊天机器人转向结构化数据模型，KumoRFM-2等新模型可直接在多表上预测，无需预处理。

核心要点

KumoRFM-2仅用少量标注样本即可在多表数据库上直接预测，性能优于传统监督模型。
企业AI需结合人工审慎验证，尤其在金融、医疗等高风险领域不可盲目依赖模型。
TabPFN等同类工具正推动表格数据预测的自动化，减少特征工程与模型调优步骤。

结构提纲

按章节快速跳转。

§告别聊天机器人时代
当前LLM无法处理企业真实数据结构，需转向更专业的预测模型。
§KumoRFM-2：多表预测新范式
该模型无需数据扁平化或特征工程，直接基于关系数据库生成预测。
§企业落地需谨慎评估
高风险场景如金融、医疗需人工校验、可解释性审查和治理机制。
§竞品动态：TabPFN与时间序列模型崛起
Prior Labs等公司正扩展表格及时间序列数据的自动化预测能力。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

企业AI转向结构化数据模型
- KumoRFM-2
  - 无需数据扁平化
  - 仅需少量标注样本
- 企业落地风险
  - 金融/医疗需人工审核
  - 需可解释性与治理
- 竞品动态
  - TabPFN
  - 时间序列模型

金句 / Highlights

值得收藏与分享的关键句。

KumoRFM-2声称在关系任务中击败监督基线和其他基础模型，仅用极少量标签。
— 第3段
⬇︎ 下载 PNG 𝕏 分享到 X
企业AI不能完全依赖LLM，需人工审慎验证、监控和可解释性审查。
— 第4段
⬇︎ 下载 PNG 𝕏 分享到 X
TabPFN旨在减少预处理、特征工程和模型选择，加速预测交付。
— 第5段
⬇︎ 下载 PNG 𝕏 分享到 X

#AI#企业AI#Kumo#TabPFN#结构化数据

打开原文

[订阅](https://gradientflow.substack.com/subscribe) • **过往期数**

你的企业数据值得比聊天机器人更好的处理方式

大型语言模型及其多模态变体仍是大多数人最先接触的基础模型。这很合理——文本、图像、音频和视频覆盖了大量知识型工作任务，而今天的聊天机器人远比许多人最初尝试的纯文本系统更强大。但企业AI并不只靠聊天驱动。它运行在表格、时间序列、交易记录、遥测数据、产品目录、客户历史、服务图谱以及那些很少能整齐地放入提示中的杂乱运营数据之上。当前的数据科学编码代理对于数据科学就让这一差距变得具体化：生成 Python 和 SQL 对代理或 LLM 来说很容易，但数据科学需要一种独特的、人类特有的怀疑精神来理解混乱的数据，并识别出结果是否过于完美以至于不可信。我们可能终于要走出企业AI基础模型的“TINA”阶段——即“只要使用LLM就能解决所有问题”的时代。新一代前沿模型看起来更加专业化，更适合真正驱动企业的预测与决策问题。

_如果你是常读用户，请考虑成为付费支持者 Image 1: 🙏 _

##### 结构化与半结构化数据迎来其基础模型时刻

**Kumo 的** 基础模型旨在处理企业数据中最宝贵的类别之一：结构化关系型数据。想象一下分布在数据仓库和数据湖中的客户记录、订单、交易、风险信号和事件历史。其论点十分直接：企业仍依赖缓慢的手工构建机器学习流水线，而LLM在将表格扁平化为文本时会丢失太多结构信息。AutoML 曾试图自动化这项工作，但主要只是通过调整旧有的连接、特征工程和模型选择流程来实现。Kumo 的关系型基础模型则另辟蹊径：它将数据库视为一个图，其中行与表变为相互关联的实体。无需手动构建特征，该模型可以直接关注原始的关系上下文并生成诸如流失风险、推荐、欺诈可能性或客户生命周期价值等预测。其吸引力在于工作流压缩：更少定制化流水线、更快迭代速度，以及一个可按需调用的预测层。

新发布的 **KumoRFM-2** 进一步强化了这一主张。它被描述为一个预训练模型，仅需查询时少量标注样本即可直接对多表数据库进行预测。换句话说，团队无需先将数据扁平化、构建特征、训练特定任务模型并维护独立的生产流水线，即可跨关联表提出预测性问题。其报告的基准结果值得注意，因为 KumoRFM-2 声称在关系型任务上同时击败监督式基线和其他基础模型方法，且仅使用极小比例的可用标签。

不过，我不会将这类基础模型视为所有预测系统的通用替代品。对于低风险路由、预测、个性化、欺诈初步筛查和运营评分，其价值可能是即时可见的。但对于量化金融、受监管信贷决策、医疗风险评分或承保业务，我会预期采取更为谨慎的路径：仔细验证、校准检查、监控、挑战模型、可解释性审查及人工治理，再部署到生产环境。

Kumo 并非唯一在此领域活跃的项目。**Prior Labs** 正致力于开发面向表格数据的基础模型，其推出的 **TabPFN** 系统旨在解决行与列预测问题，如流失、欺诈、定价、需求预测、信用评分、预测性维护和临床风险评估。其理念相似：减少团队在获得有用预测前所需的预处理、特征工程、调优和模型选择工作量。这种势头也延伸至时间序列数据领域，如今越来越多的时间序列基础模型已能在无需预先进行领域特定微调的情况下生成可靠预测。重要的一课是：结构化企业数据正逐渐成为基础模型开发的首要目标，其架构专门针对表格、关系型和时间序列数据设计。

Datadog 正朝着相关方向迈进，尽管其使用的是不同的术语。在 AI Agent Conference 上，Ameet Talwalker 描述了 Datadog 所称的“世界模型”用于可观测性的工作。我认为它应属于本讨论范畴，因为输入数据主要是结构化和半结构化的运营数据：指标、日志、追踪、服务拓扑、代码、事件、告警和事故历史。目标似乎是构建一个基础模型，学习生产软件系统随时间的行为模式，而不仅仅是汇总已发生事件的仪表板。

**Toto 2.0** 的发布进一步强化了这一叙事。Toto 最初是一个用于可观测性数据的时间序列基础模型，而新版将其转变为一系列开放权重模型，参数规模从 400 万扩展至 25 亿。Datadog 的结果显示，更大的 Toto 模型持续表现更优，运行速度远超第一代，并且即使主要训练于可观测性和合成数据，仍能泛化到可观测性之外的应用场景。对企业团队而言，实际意义在于遥测数据可能成为更丰富的预测层，用于故障检测、根因分析、模拟及自主修复。世界模型的努力正是这一方向的下一步，从预测单个数据流转向学习分布式系统如何失效、恢复并应对变化的模型。

##### AI 更贴近工作现场

同样的专业化趋势也适用于模型如何与人类互动，而不仅限于它们预测的内容。Thinking Machines 正在训练其所谓的 **“交互模型”**，支持音频、视频和文本之间的连续双向交互，而非传统的人机轮流对话模式——用户发言、等待并接收最终回复。关键的设计选择是模型实时运作，在倾听、回应并跟踪视觉线索的同时，深层推理和工具调用则在后台进行。对企业而言，这具有直接相关性：客户支持、现场服务、销售辅导、临床流程、工业操作和设计评审等场景均涉及打断、演示和实时修正。这些并非干净利落的提示-响应任务。在许多情境下，最佳界面更像是与一位能力出众的同事协作，而非提交工单。虽然目前仍处于研究预览阶段，受限于连接性和会话长度，但这一方向值得产品与平台团队密切关注。

此外，还有一波专门化的接口模型正在兴起，拓展了 AI 在工作流中嵌入的可能性。Google DeepMind 的 AI 辅助指针设想一种可跨应用跟随用户的辅助工具，理解屏幕内容，并接受如“修复这个”或“移动那个”之类的自然指令，无需精心编写提示。OpenAI 的实时语音模型亦指向相似方向，分别针对实时推理、翻译和流式转录建模。共同点在于，这些模型并非旨在打造通用聊天机器人，而是更注重 让 AI 在工作现场真正发挥作用。将这些与前述结构化数据和可观测性模型结合来看，一幅清晰图景浮现：企业 AI 正在构建一套专业化模型栈，从关系型和遥测数据上的预测引擎，到实时交互层，所有模型围绕价值实际创造的工作流协同运作。

##### 基础模型开始专业化

世界模型是一个新兴类别，我在此尚未充分探讨。其中有许多进展，部分确实令人感兴趣。但我所熟知的世界模型工作，尚不聚焦于我日常思考的企业工作流。近期与 **Rhoda AI** 和 **Odyssey** 创始人的交流对此更加明确。Rhoda 将视频原生基础模型应用于机器人任务，如倾倒、退货处理和容器拆解。Odyssey 正在构建交互式世界模拟，早期应用场景涵盖游戏、机器人、媒体及其他视觉环境。这些是重要方向，但它们更贴近物理系统和模拟世界，而非主导大多数企业 AI 路线图的混乱运营数据、预测问题和知识型工作界面。

更大的启示在于，基础模型正开始以有用的方式专业化。大型语言模型和多模态聊天机器人仍将处于核心地位，但它们不会单独承担企业级AI栈的重任。企业AI很可能依赖于一系列更针对性的模型组合：用于结构化数据的关系型模型、用于预测的时间序列模型、用于生产系统可观测性的模型、用于实时工作的交互模型，以及最终在仿真与物理推理至关重要的“世界模型”。更好的终极形态并非一个能处理所有任务的巨型模型，而是一个路由层——它能够识别任务需求，并将其导向最适合该任务的特定模型。