T
traeai
登录
返回首页
Gradient Flow

最聪明的AI团队正在超越聊天机器人

8.5Score
最聪明的AI团队正在超越聊天机器人

TL;DR · AI 摘要

企业AI正从聊天机器人转向结构化数据模型,KumoRFM-2等新模型可直接在多表上预测,无需预处理。

核心要点

  • KumoRFM-2仅用少量标注样本即可在多表数据库上直接预测,性能优于传统监督模型。
  • 企业AI需结合人工审慎验证,尤其在金融、医疗等高风险领域不可盲目依赖模型。
  • TabPFN等同类工具正推动表格数据预测的自动化,减少特征工程与模型调优步骤。

结构提纲

按章节快速跳转。

  1. 当前LLM无法处理企业真实数据结构,需转向更专业的预测模型。

  2. 该模型无需数据扁平化或特征工程,直接基于关系数据库生成预测。

  3. 高风险场景如金融、医疗需人工校验、可解释性审查和治理机制。

  4. §竞品动态:TabPFN与时间序列模型崛起

    Prior Labs等公司正扩展表格及时间序列数据的自动化预测能力。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • 企业AI转向结构化数据模型
    • KumoRFM-2
      • 无需数据扁平化
      • 仅需少量标注样本
    • 企业落地风险
      • 金融/医疗需人工审核
      • 需可解释性与治理
    • 竞品动态
      • TabPFN
      • 时间序列模型

金句 / Highlights

值得收藏与分享的关键句。

#AI#企业AI#Kumo#TabPFN#结构化数据
打开原文

[订阅](https://gradientflow.substack.com/subscribe) • **过往期数**

你的企业数据值得比聊天机器人更好的处理方式

大型语言模型及其多模态变体仍是大多数人最先接触的基础模型。这很合理——文本、图像、音频和视频覆盖了大量知识型工作任务,而今天的聊天机器人远比许多人最初尝试的纯文本系统更强大。但企业AI并不只靠聊天驱动。它运行在表格、时间序列、交易记录、遥测数据、产品目录、客户历史、服务图谱以及那些很少能整齐地放入提示中的杂乱运营数据之上。当前的数据科学编码代理 对于数据科学 就让这一差距变得具体化:生成 Python 和 SQL 对代理或 LLM 来说很容易,但数据科学需要一种独特的、人类特有的怀疑精神来理解混乱的数据,并识别出结果是否过于完美以至于不可信。我们可能终于要走出企业AI基础模型的“TINA”阶段——即“只要使用LLM就能解决所有问题”的时代。新一代前沿模型看起来更加专业化,更适合真正驱动企业的预测与决策问题。

_如果你是常读用户,请考虑成为付费支持者 Image 1: 🙏_

##### 结构化与半结构化数据迎来其基础模型时刻

**Kumo 的** 基础模型旨在处理企业数据中最宝贵的类别之一:结构化关系型数据。想象一下分布在数据仓库和数据湖中的客户记录、订单、交易、风险信号和事件历史。其论点十分直接:企业仍依赖缓慢的手工构建机器学习流水线,而LLM在将表格扁平化为文本时会丢失太多结构信息。AutoML 曾试图自动化这项工作,但主要只是通过调整旧有的连接、特征工程和模型选择流程来实现。Kumo 的关系型基础模型 则另辟蹊径:它将数据库视为一个图,其中行与表变为相互关联的实体。无需手动构建特征,该模型可以直接关注原始的关系上下文并生成诸如流失风险、推荐、欺诈可能性或客户生命周期价值等预测。其吸引力在于工作流压缩:更少定制化流水线、更快迭代速度,以及一个可按需调用的预测层。

新发布的 **KumoRFM-2** 进一步强化了这一主张。它被描述为一个预训练模型,仅需查询时少量标注样本即可直接对多表数据库进行预测。换句话说,团队无需先将数据扁平化、构建特征、训练特定任务模型并维护独立的生产流水线,即可跨关联表提出预测性问题。其报告的基准结果值得注意,因为 KumoRFM-2 声称在关系型任务上同时击败监督式基线和其他基础模型方法,且仅使用极小比例的可用标签。

Image 2

不过,我不会将这类基础模型视为所有预测系统的通用替代品。对于低风险路由、预测、个性化、欺诈初步筛查和运营评分,其价值可能是即时可见的。但对于量化金融、受监管信贷决策、医疗风险评分或承保业务,我会预期采取更为谨慎的路径:仔细验证、校准检查、监控、挑战模型、可解释性审查及人工治理,再部署到生产环境。

Kumo 并非唯一在此领域活跃的项目。**Prior Labs** 正致力于开发面向表格数据的基础模型,其推出的 **TabPFN** 系统旨在解决行与列预测问题,如流失、欺诈、定价、需求预测、信用评分、预测性维护和临床风险评估。其理念相似:减少团队在获得有用预测前所需的预处理、特征工程、调优和模型选择工作量。这种势头也延伸至时间序列数据领域,如今越来越多的 时间序列基础模型 已能在无需预先进行领域特定微调的情况下生成可靠预测。重要的一课是:结构化企业数据正逐渐成为基础模型开发的首要目标,其架构专门针对表格、关系型和时间序列数据设计。

Image 3

Datadog 正朝着相关方向迈进,尽管其使用的是不同的术语。在 AI Agent Conference 上,Ameet Talwalker 描述了 Datadog 所称的“世界模型”用于可观测性的工作。我认为它应属于本讨论范畴,因为输入数据主要是结构化和半结构化的运营数据:指标、日志、追踪、服务拓扑、代码、事件、告警和事故历史。目标似乎是构建一个基础模型,学习生产软件系统随时间的行为模式,而不仅仅是汇总已发生事件的仪表板。

Image 4

**Toto 2.0** 的发布进一步强化了这一叙事。Toto 最初是一个用于可观测性数据的时间序列基础模型,而新版将其转变为一系列开放权重模型,参数规模从 400 万扩展至 25 亿。Datadog 的结果显示,更大的 Toto 模型持续表现更优,运行速度远超第一代,并且即使主要训练于可观测性和合成数据,仍能泛化到可观测性之外的应用场景。对企业团队而言,实际意义在于遥测数据可能成为更丰富的预测层,用于故障检测、根因分析、模拟及自主修复。世界模型的努力正是这一方向的下一步,从预测单个数据流转向学习分布式系统如何失效、恢复并应对变化的模型。

##### AI 更贴近工作现场

同样的专业化趋势也适用于模型如何与人类互动,而不仅限于它们预测的内容。Thinking Machines 正在训练其所谓的 **“交互模型”**,支持音频、视频和文本之间的连续双向交互,而非传统的人机轮流对话模式——用户发言、等待并接收最终回复。关键的设计选择是模型实时运作,在倾听、回应并跟踪视觉线索的同时,深层推理和工具调用则在后台进行。对企业而言,这具有直接相关性:客户支持、现场服务、销售辅导、临床流程、工业操作和设计评审等场景均涉及打断、演示和实时修正。这些并非干净利落的提示-响应任务。在许多情境下,最佳界面更像是与一位能力出众的同事协作,而非提交工单。虽然目前仍处于研究预览阶段,受限于连接性和会话长度,但这一方向值得产品与平台团队密切关注。

Image 5

此外,还有一波专门化的接口模型正在兴起,拓展了 AI 在工作流中嵌入的可能性。Google DeepMind 的 AI 辅助指针 设想一种可跨应用跟随用户的辅助工具,理解屏幕内容,并接受如“修复这个”或“移动那个”之类的自然指令,无需精心编写提示。OpenAI 的 实时语音模型 亦指向相似方向,分别针对实时推理、翻译和流式转录建模。共同点在于,这些模型并非旨在打造通用聊天机器人,而是更注重 让 AI 在工作现场真正发挥作用。将这些与前述结构化数据和可观测性模型结合来看,一幅清晰图景浮现:企业 AI 正在构建一套专业化模型栈,从关系型和遥测数据上的预测引擎,到实时交互层,所有模型围绕价值实际创造的工作流协同运作。

##### 基础模型开始专业化

世界模型 是一个新兴类别,我在此尚未充分探讨。其中有许多进展,部分确实令人感兴趣。但我所熟知的世界模型工作,尚不聚焦于我日常思考的企业工作流。近期与 **Rhoda AI****Odyssey** 创始人的交流对此更加明确。Rhoda 将视频原生基础模型应用于机器人任务,如倾倒、退货处理和容器拆解。Odyssey 正在构建交互式世界模拟,早期应用场景涵盖游戏、机器人、媒体及其他视觉环境。这些是重要方向,但它们更贴近物理系统和模拟世界,而非主导大多数企业 AI 路线图的混乱运营数据、预测问题和知识型工作界面。

Image 6

更大的启示在于,基础模型正开始以有用的方式专业化。大型语言模型和多模态聊天机器人仍将处于核心地位,但它们不会单独承担企业级AI栈的重任。企业AI很可能依赖于一系列更针对性的模型组合:用于结构化数据的关系型模型、用于预测的时间序列模型、用于生产系统可观测性的模型、用于实时工作的交互模型,以及最终在仿真与物理推理至关重要的“世界模型”。更好的终极形态并非一个能处理所有任务的巨型模型,而是一个路由层——它能够识别任务需求,并将其导向最适合该任务的特定模型。

AI 可能会生成不准确的信息,请核实重要内容