DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速
DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”,昇腾CANN开源后开发者可自主解决问题,70+主流大模型发布即适配,AIGCode实现65% MFU、中科大LU求解器达200倍加速,金融级系统已上线核心风控,鲲鹏/昇腾开发者超410万,飞轮效应正式形成。
入选理由:CANN生态从2024年初‘幼儿期’发展至2026年‘青年期’,65个源码仓分层解耦,70+主流大模型发布即适配。
模型
别名:V4-Preview、V4-Pro、V4-Flash
与Opus 4.8竞争的AI模型,性能接近。
已跟踪 18 条高相关材料
最近变化
2026-06-06 · Codex新增站点插件,可生成内部工具并部署到互联网。
为什么值得关注
DeepSeek v4 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
DeepSeek V4芯模协同背后,国产算力生态开始飞轮加速
量子位 · 9.2 分
DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”,昇腾CANN开源后开发者可自主解决问题,70+主流大模型发布即适配,AIGCode实现65% MFU、中科大LU求解器达200倍加速,金融级系统已上线核心风控,鲲鹏/昇腾开发者超410万,飞轮效应正式形...
体验完腾讯发布的 Marvis 助手,我发现个人 AI 的尽头是操作系统
爱范儿 · 8.7 分
腾讯Marvis助手通过操作系统级AI代理架构,实现对PC与手机的深度控制与语义理解,首次让普通用户能用自然语言直接操作文件、系统设置与跨端应用,突破了传统AI助手仅限对话的局限。
DeepSeek reasonix, DeepSeek native coding agent with high caching and low cost
Hacker News Best · 8.5 分
Reasonix 是一个专为 DeepSeek API 设计的终端原生 AI 编程助手,通过字节稳定缓存机制实现高达 94% 的缓存命中率和 2.5 倍成本降低。
已收录 18 条与 DeepSeek v4 相关的内容,按评分排序。
DeepSeek V4标志着国产算力生态从“芯片适配模型”转向“芯模协同”,昇腾CANN开源后开发者可自主解决问题,70+主流大模型发布即适配,AIGCode实现65% MFU、中科大LU求解器达200倍加速,金融级系统已上线核心风控,鲲鹏/昇腾开发者超410万,飞轮效应正式形成。
入选理由:CANN生态从2024年初‘幼儿期’发展至2026年‘青年期’,65个源码仓分层解耦,70+主流大模型发布即适配。
腾讯Marvis助手通过操作系统级AI代理架构,实现对PC与手机的深度控制与语义理解,首次让普通用户能用自然语言直接操作文件、系统设置与跨端应用,突破了传统AI助手仅限对话的局限。
入选理由:Marvis内置六个专用AI代理(PM、File、Computer等),开箱即用,无需用户配置工作流。
Reasonix 是一个专为 DeepSeek API 设计的终端原生 AI 编程助手,通过字节稳定缓存机制实现高达 94% 的缓存命中率和 2.5 倍成本降低。
入选理由:Reasonix 使用 DeepSeek 的 prefix cache 机制,实现 94% 缓存命中率和 1/5 输入 token 成本
LLM架构近期发展聚焦于KV共享、mHC和压缩注意力,以提升长上下文效率。
入选理由:Gemma 4引入KV共享和每层嵌入,优化内存使用。
DeepSeek V4价格大幅下降,Reasonix工具通过缓存优化将成本降至2折,命中率达99.82%。
入选理由:Reasonix工具使DeepSeek V4成本从61美元降至12美元,降幅达80%
DeepSeekV4发布,通过组合创新和工程优化,在R1的“测试时扩展”范式下,实现百万上下文从理论到实用的飞跃,对Agent和多步复杂任务具有重要意义。
入选理由:DeepSeek V4沿用现有范式,未带来范式变化,但通过一系列技术创新显著提升了长上下文处理能力。
文章探讨了DeepSeek V4模型中tid2eid映射表的生成机制。
入选理由:DeepSeek V4采用hash routing替代first_k_dense策略
DeepSeek-V4面临百万token上下文推理问题,提出优化策略并展示性能提升。
入选理由:DeepSeek-V4处理百万token上下文的挑战
AI 可通过 GenSpark 平台调用多个专业代理(如研究、语音脚本、呼叫代理等)自动拨打 100 个英国水管工电话,以验证其作为 24/7 接待员的商业化潜力;实验中 AI 成功引导用户跳转至预约页面,但未披露最终转化数据。
入选理由:使用 GenSpark 构建多代理 AI 系统,整合研究、Stripe、语音脚本、呼叫、收件箱等 6 类代理。
DeepSeek 全面开源 V4 系列模型(含 1M 上下文、1.6T 参数 Pro 版),被解读为以‘孙子兵法’式战略瓦解美国 AI 垄断逻辑:当 AGI 核心技术公开,闭源护城河崩塌,估值与商业模型将重构。
入选理由:DeepSeek-V4-Pro 以 1.6T 总参数、49B 活跃参数实现媲美顶级闭源模型的性能,并完全开源。
NVIDIA AI 报告称,SGLang 在 Blackwell 硬件上使用 DeepSeek-V4 模型解码达到 180 tok/s/GPU 的速度,约 1M 上下文,得益于 LMSYS 组织针对 Blackwell 的特定优化,提高了混合稀疏注意力的利用效率。
入选理由:SGLang 在 DeepSeek-V4 解码任务上实现高性能,达 180 tok/s/GPU。
DeepSeek V4的发布标志着国产AI模型与华为昇腾算力结合,挑战NVIDIA垄断,腾讯阿里未涉足的领域。梁文锋计划融资100亿美金,旨在未来五年AI战略卡位,探索算力、电力、地权等大模型关键支撑。
入选理由:DeepSeek V4适配华为昇腾,降低价格,深化国产算力与顶级模型合作。
AI代理平台更新迅速,Codex新增站点插件,Hermes推出超级应用,DeepSeek v4与Opus竞争。
入选理由:Codex新增站点插件,可生成内部工具并部署到互联网。
本文介绍了如何在VS Code中集成DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型,通过Continuedev插件实现代码补全、AI聊天和编辑功能。
入选理由:通过Continuedev插件可以在VS Code中运行DeepSeek V4、GLM-5.1、Kimi K2.6等AI模型。
科技早报汇总显示AI Agent互操作与记忆架构取得实质进展,微信A2A助手落地、ChatGPT记忆准确率升至82.8%,但整体为新闻聚合缺乏深度技术解析。
入选理由:微信与手机厂商合作A2A助手,通过双重授权机制实现跨应用消息发送与通话指令。
DeepSeek V4被宣传为接近SOTA、开源、极低成本($1.74/百万token)且支持本地部署的AI模型,但原文无技术细节、实测数据或架构说明,属典型短视频营销话术。
入选理由:宣称DeepSeek V4成本仅为GPT-5.5和Claude Opus的约1/3
视频宣传免费的Deepseek-V4 PRO AI编码器,讨论其功能与影响,但正文内容缺失,无法深入评估。
入选理由:Deepseek-V4 PRO被宣传为AI编码工具,号称完全免费。
文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单,但正文内容无法正常访问,无法评估深度、新颖性、实用性与可信度。
入选理由:文章标题提及DeepSeek V4在昇腾平台的性能表现促使客户快速下单,但正文内容无法正常访问,无法评估深度、新颖性、实用性与可信度