DeepSeek v4 最近有什么新动态？

traeai 已收录 18 篇与 DeepSeek v4 相关的内容。最新一篇是「DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速」，由量子位发布。

模型

DeepSeek v4

别名：V4-Preview、V4-Pro、V4-Flash

与Opus 4.8竞争的AI模型，性能接近。

已跟踪 18 条高相关材料

TraeAI 观察

如果只读 3 篇

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

量子位 · 9.2 分

DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”，昇腾CANN开源后开发者可自主解决问题，70+主流大模型发布即适配，AIGCode实现65% MFU、中科大LU求解器达200倍加速，金融级系统已上线核心风控，鲲鹏/昇腾开发者超410万，飞轮效应正式形...

体验完腾讯发布的 Marvis 助手，我发现个人 AI 的尽头是操作系统

爱范儿 · 8.7 分

腾讯Marvis助手通过操作系统级AI代理架构，实现对PC与手机的深度控制与语义理解，首次让普通用户能用自然语言直接操作文件、系统设置与跨端应用，突破了传统AI助手仅限对话的局限。

DeepSeek reasonix, DeepSeek native coding agent with high caching and low cost

Hacker News Best · 8.5 分

Reasonix 是一个专为 DeepSeek API 设计的终端原生 AI 编程助手，通过字节稳定缓存机制实现高达 94% 的缓存命中率和 2.5 倍成本降低。

DeepSeek V4芯模协同背后，国产算力生态开始飞轮加速

量子位5月28日3544 字 (约 15 分钟)

DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”，昇腾CANN开源后开发者可自主解决问题，70+主流大模型发布即适配，AIGCode实现65% MFU、中科大LU求解器达200倍加速，金融级系统已上线核心风控，鲲鹏/昇腾开发者超410万，飞轮效应正式形成。

入选理由：CANN生态从2024年初‘幼儿期’发展至2026年‘青年期’，65个源码仓分层解耦，70+主流大模型发布即适配。

精选文章#昇腾#CANN#芯模协同#国产算力#大模型中文

体验完腾讯发布的 Marvis 助手，我发现个人 AI 的尽头是操作系统

爱范儿5月20日3439 字 (约 14 分钟)

入选理由：Marvis内置六个专用AI代理（PM、File、Computer等），开箱即用，无需用户配置工作流。

精选文章#AI助手#操作系统#腾讯#Marvis#端侧AI中文

Reasonix — DeepSeek 原生 AI 编程助手

Hacker News Best5月24日1267 字 (约 6 分钟)

Reasonix 是一个专为 DeepSeek API 设计的终端原生 AI 编程助手，通过字节稳定缓存机制实现高达 94% 的缓存命中率和 2.5 倍成本降低。

入选理由：Reasonix 使用 DeepSeek 的 prefix cache 机制，实现 94% 缓存命中率和 1/5 输入 token 成本

精选文章#AI Agent#终端#DeepSeek#缓存#LLM英文

Recent Developments in LLM Architectures: KV Sharing, mHC, and Compressed Attention

LLM架构近期发展：KV共享、mHC和压缩注意力

Ahead of AI5月18日5634 字 (约 23 分钟)

LLM架构近期发展聚焦于KV共享、mHC和压缩注意力，以提升长上下文效率。

入选理由：Gemma 4引入KV共享和每层嵌入，优化内存使用。

精选文章#LLM#架构优化#注意力机制英文

DeepSeek V4还能更省！新工具缓存命中率高达99.82%，2折稳定到手

量子位5月25日1212 字 (约 5 分钟)

DeepSeek V4价格大幅下降，Reasonix工具通过缓存优化将成本降至2折，命中率达99.82%。

入选理由：Reasonix工具使DeepSeek V4成本从61美元降至12美元，降幅达80%

精选文章#DeepSeek#AI模型#缓存优化#开源工具#成本控制中文

163: 详解DeepSeekV4：Infra巨鲸、百万上下文走进现实、极致效率优化

晚点聊 LateTalk5月1日2079 字 (约 9 分钟)

DeepSeekV4发布，通过组合创新和工程优化，在R1的“测试时扩展”范式下，实现百万上下文从理论到实用的飞跃，对Agent和多步复杂任务具有重要意义。

入选理由：DeepSeek V4沿用现有范式，未带来范式变化，但通过一系列技术创新显著提升了长上下文处理能力。

精选播客#DeepSeek#大模型#注意力机制#优化器#稀疏注意力中文

DeepSeek V4的tid2eid是怎么来的？

科学空间5月15日3057 字 (约 13 分钟)

文章探讨了DeepSeek V4模型中tid2eid映射表的生成机制。

入选理由：DeepSeek V4采用hash routing替代first_k_dense策略

精选文章#深度学习#模型架构#MoE中文

Serving DeepSeek-V4: why million-token context is an inference systems problem

Together AI Blog5月10日3411 字 (约 14 分钟)

DeepSeek-V4面临百万token上下文推理问题，提出优化策略并展示性能提升。

入选理由：DeepSeek-V4处理百万token上下文的挑战

精选文章#DeepSeek-V4#推理系统#百万token中文

I Let AI Cold-Call 100 Plumbers (Genspark)

我让 AI 给 100 个水管工打冷电话（GenSpark 实验）

Siraj Raval5月23日2009 字 (约 9 分钟)

AI 可通过 GenSpark 平台调用多个专业代理（如研究、语音脚本、呼叫代理等）自动拨打 100 个英国水管工电话，以验证其作为 24/7 接待员的商业化潜力；实验中 AI 成功引导用户跳转至预约页面，但未披露最终转化数据。

入选理由：使用 GenSpark 构建多代理 AI 系统，整合研究、Stripe、语音脚本、呼叫、收件箱等 6 类代理。

精选视频#GenSpark#AI 代理#冷电话营销#语音 AI#GPT-5.5英文

I swear DeepSeek open-sourcing everything is some Sun-Tzu shit. America is trying to build trillio...

AI Breakfast(@AiBreakfast)5月2日413 字 (约 2 分钟)

DeepSeek 全面开源 V4 系列模型（含 1M 上下文、1.6T 参数 Pro 版），被解读为以‘孙子兵法’式战略瓦解美国 AI 垄断逻辑：当 AGI 核心技术公开，闭源护城河崩塌，估值与商业模型将重构。

入选理由：DeepSeek-V4-Pro 以 1.6T 总参数、49B 活跃参数实现媲美顶级闭源模型的性能，并完全开源。

精选推文#DeepSeek#开源#大模型#AI战略#AGI中文

SGLang is hitting 180 tok/s/GPU on DeepSeek-V4 decode with ~1M context on Blackwell. Good to see f...

NVIDIA AI(@NVIDIAAI)5月1日212 字 (约 1 分钟)

NVIDIA AI 报告称，SGLang 在 Blackwell 硬件上使用 DeepSeek-V4 模型解码达到 180 tok/s/GPU 的速度，约 1M 上下文，得益于 LMSYS 组织针对 Blackwell 的特定优化，提高了混合稀疏注意力的利用效率。

入选理由：SGLang 在 DeepSeek-V4 解码任务上实现高性能，达 180 tok/s/GPU。

精选推文#NVIDIA#DeepSeek-V4#SGLang#Blackwell#LMSYS中文

因为我善？DeepSeekV4 国产适配和100 亿美金融资背后的阳谋，黄仁勋最怕的噩梦成真了！

人民公园说AI5月1日460 字 (约 2 分钟)

DeepSeek V4的发布标志着国产AI模型与华为昇腾算力结合，挑战NVIDIA垄断，腾讯阿里未涉足的领域。梁文锋计划融资100亿美金，旨在未来五年AI战略卡位，探索算力、电力、地权等大模型关键支撑。

入选理由：DeepSeek V4适配华为昇腾，降低价格，深化国产算力与顶级模型合作。

精选播客#DeepSeek#华为昇腾#AI模型#融资策略#算力竞争中文

Hermes Agent NEW Super-App and DeepSeek v4 Catches Up To Opus 4.8?

Riley Brown昨天5752 字 (约 24 分钟)

AI代理平台更新迅速，Codex新增站点插件，Hermes推出超级应用，DeepSeek v4与Opus竞争。

入选理由：Codex新增站点插件，可生成内部工具并部署到互联网。

精选视频#AI代理#Codex#Hermes#DeepSeek#Opus英文

在VS Code中集成多款AI模型开发

AI HOT 精选5月13日144 字 (约 1 分钟)

本文介绍了如何在VS Code中集成DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型，通过Continuedev插件实现代码补全、AI聊天和编辑功能。

入选理由：通过Continuedev插件可以在VS Code中运行DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型。

精选文章#VS Code#AI模型#开发工具#Continuedev英文

早报｜苹果App Store四成头部应用已支持AI/千问上线肯德基skill/奈雪擦边LABUBU被判赔32万

爱范儿6月5日5486 字 (约 22 分钟)

科技早报汇总显示AI Agent互操作与记忆架构取得实质进展，微信A2A助手落地、ChatGPT记忆准确率升至82.8%，但整体为新闻聚合缺乏深度技术解析。

入选理由：微信与手机厂商合作A2A助手，通过双重授权机制实现跨应用消息发送与通话指令。

精选文章#AI Agent#LLM Memory#A2A Protocol#AI Infrastructure中文

Deepseek V4 May Disrupt The Entire AI Economy

Matt Wolfe5月3日274 字 (约 2 分钟)

DeepSeek V4被宣传为接近SOTA、开源、极低成本（$1.74/百万token）且支持本地部署的AI模型，但原文无技术细节、实测数据或架构说明，属典型短视频营销话术。

入选理由：宣称DeepSeek V4成本仅为GPT-5.5和Claude Opus的约1/3

精选视频#AI#LLM#DeepSeek#open-source#AI-economy中文

UNLIMITED FREE Deepseek-V4 PRO AI Coder: THIS IS CRAZY!

AICodeKing5月1日1745 字 (约 7 分钟)

视频宣传免费的Deepseek-V4 PRO AI编码器，讨论其功能与影响，但正文内容缺失，无法深入评估。

入选理由：Deepseek-V4 PRO被宣传为AI编码工具，号称完全免费。

精选视频#AI#编码器#Deepseek-V4#YouTube其他

“客户测950，不到一周下单了”，DeepSeek V4 逼出昇腾真功夫

AI前线4月30日49 字 (约 1 分钟)

文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单，但正文内容无法正常访问，无法评估深度、新颖性、实用性与可信度。

入选理由：文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单，但正文内容无法正常访问，无法评估深度、新颖性、实用性与可信度

精选文章#DeepSeek#昇腾中文

跨材料问答 · DeepSeek v4

回答基于：DeepSeek v4 相关 18 条材料