T
traeai
登录
返回首页
AI HOT 精选

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

8.2Score
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

TL;DR · AI 摘要

面壁智能联合清华等发布中国首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN,支持6倍显存压缩且性能保持90%以上。

核心要点

  • BitCPM-CANN是中国首个基于华为昇腾训练并开源的1.58-bit端侧大模型。
  • 该模型推理时显存占用降低约6倍,模型能力保留率达90%-97.2%。
  • 支持0.5B至8B四种参数规模,可在主流手机上部署运行。

结构提纲

按章节快速跳转。

  1. BitCPM-CANN是中国首个基于国产昇腾平台训练的低比特端侧大模型。

  2. 采用1.58-bit三值量化,在昇腾平台上完成全流程训练和部署。

  3. 相比BF16精度,显存节省6倍,模型能力保留率在90%至97.2%之间。

  4. 依托MindSpeed×Megatron-LM构建完整的低比特训练基础设施。

  5. 提供0.5B、1B、3B、8B四个版本,并已在HuggingFace和ModelScope开源。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • BitCPM-CANN 模型
    • 技术特性
      • 1.58-bit 三值量化
      • 昇腾平台原生训练
    • 性能优势
      • 显存节省6倍
      • 能力保留率90%-97.2%
    • 应用场景
      • 移动端部署
      • 多尺寸支持

金句 / Highlights

值得收藏与分享的关键句。

  • 这是中国首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。

    第1段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 相比传统 BF16 精度,BitCPM-CANN 在推理阶段释放约 6 倍显存红利,同时将模型能力保留率维持在 90%–97.2%

    第2段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 一个 8B 参数的 BitCPM-CANN 大模型,可以轻松运行在当前主流旗舰手机之上。

    第3段

    ⬇︎ 下载 PNG𝕏 分享到 X
#大模型#低比特量化#华为昇腾#端侧AI#开源模型
打开原文

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN - IT之家

App公众号投稿评论[顶部](javascript:; "顶部")

Image 3
Image 4

[](https://www.ithome.com/)[](https://img.ithome.com/app/songs/index.html)

首页

IT圈

最会买

设置

  • 日夜间 随系统 浅色 深色
  • 主题色 黑色

投稿

订阅

  • RSS订阅
  • [收藏IT之家](https://www.ithome.com/0/954/759.htm# "IT之家")

软媒应用

注册[登录](javascript:;)

业界手机电脑测评视频AI苹果iPhone鸿蒙软件

智车数码学院游戏直播5G微软Win10Win11专题

搜索

热搜:小米华为苹果deepseek荣耀显示器追觅OPPO极狐特斯拉

神舟二十三号乘组顺利进驻“天宫”DeepSeek API 完成输出提速与服务扩容

![Image 5京东 618 抢红包 购痛快 剩3次Image 6](https://u.jd.com/HrKCmxa)![Image 7天天开红包 最高 26888 元 速抢Image 8](https://s.click.taobao.com/CV62bql)广 告Image 9

首页>智能时代>人工智能

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

2026/5/25 11:48:30 来源:IT之家作者:沁沧(实习)责编:沁沧

评论:4

IT之家 5 月 25 日消息,面壁智能联合清华大学、OpenBMB 开源社区,今天正式发布并开源其在低比特大模型训练方向的最新成果 ——BitCPM-CANN。

官方表示,这是中国首个完全基于国产算力平台(华为昇腾)实现端到端训练并开源的三值(1.58-bit)大模型。从量化算子、训练算法到全链路框架,BitCPM-CANN 均在华为昇腾上原生完成,包含 0.5B、1B、3B、8B 四个模型尺寸,与同尺寸 MiniCPM4 全精度家族逐项对照评测,性能表现优异。

Image 10: 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

相比传统 BF16 精度,BitCPM-CANN 在推理阶段释放约 6 倍显存红利,同时将模型能力保留率维持在 90%–97.2%

Image 11: 面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

官方表示,对手机产业来说,6 倍的显存红利意味着,一个 8B 参数的 BitCPM-CANN 大模型,可以轻松运行在当前主流旗舰手机之上

此外,面壁智能基于 MindSpeed × Megatron-LM 主干搭建了完整的低比特训练底座,包含环境适配、32K 长序列支持、并行策略、融合算子等完整工程体系。从此,所有面向昇腾的低比特训练工作,都可建立在同一套公共基础设施之上

BitCPM-CANN 0.5B / 1B / 3B / 8B 全系列模型权重现已开源,IT之家附链接如下:

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

投诉水文 我要纠错

打分人数少于5人,暂不显示文章价值得分

有价值

2

无价值

0

[](https://connect.qq.com/widget/shareqq/index.html?url=https%3a%2f%2fwww.ithome.com%2f0%2f954%2f759.htm&title=%e9%9d%a2%e5%a3%81%e6%99%ba%e8%83%bd%e8%81%94%e5%90%88%e6%b8%85%e5%8d%8e%e7%ad%89%e5%bc%80%e6%ba%90%e4%b8%ad%e5%9b%bd%e9%a6%96%e4%b8%aa%e5%9f%ba%e4%ba%8e%e5%8d%8e%e4%b8%ba%e6%98%87%e8%85%be%e8%ae%ad%e7%bb%83%e7%9a%84+1.58-bit+%e7%ab%af%e4%be%a7%e5%a4%a7%e6%a8%a1%e5%9e%8b+BitCPM-CANN&summary= "分享到QQ")[](https://www.ithome.com/0/954/759.htm# "分享到微信")[](https://service.weibo.com/share/share.php?url=https%3a%2f%2fwww.ithome.com%2f0%2f954%2f759.htm&title=%e9%9d%a2%e5%a3%81%e6%99%ba%e8%83%bd%e8%81%94%e5%90%88%e6%b8%85%e5%8d%8e%e7%ad%89%e5%bc%80%e6%ba%90%e4%b8%ad%e5%9b%bd%e9%a6%96%e4%b8%aa%e5%9f%ba%e4%ba%8e%e5%8d%8e%e4%b8%ba%e6%98%87%e8%85%be%e8%ae%ad%e7%bb%83%e7%9a%84+1.58-bit+%e7%ab%af%e4%be%a7%e5%a4%a7%e6%a8%a1%e5%9e%8b+BitCPM-CANN "分享到新浪微博")

下载IT之家APP,签到赚金币兑豪礼

相关文章

关键词:面壁智能清华开源华为昇腾大模型

  • 日榜
  • 周榜
  • 月榜
  • [“死了么”App 被“收编”:改名“在么在么”,用于独居、空巢老人监测](https://www.ithome.com/0/954/638.htm "“死了么”App 被“收编”:改名“在么在么”,用于独居、空巢老人监测")
  • [小鹏副总裁:小鹏可能是唯一一个欢迎特斯拉 FSD 入华的车企](https://www.ithome.com/0/954/523.htm "小鹏副总裁:小鹏可能是唯一一个欢迎特斯拉 FSD 入华的车企")
  • [酷态科 10 号超级电能充 Ultra 199 → 129 元,支持 iPhone 17 全系快充 + 支持米家](https://www.ithome.com/0/954/616.htm "酷态科 10 号超级电能充 Ultra 199 → 129 元,支持 iPhone 17 全系快充 + 支持米家")
  • [吉利帝豪向上系列汽车上市:搭载全新 1.5L 直列四缸发动机,限时感恩价 5.59 万元起](https://www.ithome.com/0/954/588.htm "吉利帝豪向上系列汽车上市:搭载全新 1.5L 直列四缸发动机,限时感恩价 5.59 万元起")
  • [雅马哈 2026 款巧格 iPlus 摩托车上市:8380 元起,升级宽胎 + 彩色仪表但仍无 ABS](https://www.ithome.com/0/954/593.htm "雅马哈 2026 款巧格 iPlus 摩托车上市:8380 元起,升级宽胎 + 彩色仪表但仍无 ABS")
  • [英伟达 CFO:我们预判到内存价格会飙升,早已提前下单](https://www.ithome.com/0/954/623.htm "英伟达 CFO:我们预判到内存价格会飙升,早已提前下单")
  • [华为余承东:问界 M9 率先搭载全新一代的鸿蒙座舱,灯随人动、手势即达](https://www.ithome.com/0/954/582.htm "华为余承东:问界 M9 率先搭载全新一代的鸿蒙座舱,灯随人动、手势即达")
  • [华为发表半导体韬定律:预计到 2031 年,基于该定律的高端芯片晶体管密度将达到 1.4 纳米制程的同等水平](https://www.ithome.com/0/954/677.htm "华为发表半导体韬定律:预计到 2031 年,基于该定律的高端芯片晶体管密度将达到 1.4 纳米制程的同等水平")
  • [神舟二十三号载人飞船发射取得圆满成功](https://www.ithome.com/0/954/642.htm "神舟二十三号载人飞船发射取得圆满成功")
  • [Mate 90 系列首发?华为今年秋季发布全新麒麟手机芯片:完整采用逻辑折叠技术,大幅提升相关性能](https://www.ithome.com/0/954/702.htm "Mate 90 系列首发?华为今年秋季发布全新麒麟手机芯片:完整采用逻辑折叠技术,大幅提升相关性能")
  • [豆瓣 9.1 分,五一档黑马《给阿嬷的情书》电影票房破 10 亿](https://www.ithome.com/0/954/545.htm "豆瓣 9.1 分,五一档黑马《给阿嬷的情书》电影票房破 10 亿")
  • [别克今日官宣 20 号发布会上“不能说的秘密”:周杰伦成为至境世家 MPV 代言人](https://www.ithome.com/0/954/620.htm "别克今日官宣 20 号发布会上“不能说的秘密”:周杰伦成为至境世家 MPV 代言人")
  • [小米 17 Max 手机发布:8000mAh 电池、2 亿像素徕卡主摄,国补到手价 4299 元起](https://www.ithome.com/0/953/605.htm "小米 17 Max 手机发布:8000mAh 电池、2 亿像素徕卡主摄,国补到手价 4299 元起")
  • [小米 YU7 GT 正式发布:38.99 万元起,“大满配”42.99 万元](https://www.ithome.com/0/953/623.htm "小米 YU7 GT 正式发布:38.99 万元起,“大满配”42.99 万元")
  • [特斯拉监督版 FSD 官宣登陆中国](https://www.ithome.com/0/953/120.htm "特斯拉监督版 FSD 官宣登陆中国")
  • [1 分钟速通 618·525 秒杀攻略:小米 15 Ultra 16+512G 4099 元,京东 11.9 元寄 10 斤上门取件](https://www.ithome.com/0/953/084.htm "1 分钟速通 618·525 秒杀攻略:小米 15 Ultra 16+512G 4099 元,京东 11.9 元寄 10 斤上门取件")
  • [DeepSeek-V4-Pro API 宣布永久降价,调整为原定价的 1/4](https://www.ithome.com/0/954/188.htm "DeepSeek-V4-Pro API 宣布永久降价,调整为原定价的 1/4")
  • [雷军豪言“再次挑战 Model Y”:小米 YU7 标准版发布,23.35 万元](https://www.ithome.com/0/953/614.htm "雷军豪言“再次挑战 Model Y”:小米 YU7 标准版发布,23.35 万元")
  • [小米通报两起空调安装抽真空造假事件:涉事工程师永久拉黑](https://www.ithome.com/0/954/263.htm "小米通报两起空调安装抽真空造假事件:涉事工程师永久拉黑")
  • [外媒上手特朗普 T1 手机:不再标榜“美国制造”,预估基于 HTC U24 Pro 改造](https://www.ithome.com/0/952/695.htm "外媒上手特朗普 T1 手机:不再标榜“美国制造”,预估基于 HTC U24 Pro 改造")
  • [雷军回应只公布锁单数据:去年小米 YU7 三分钟大定超过 20 万辆,行业没有人信,觉得数据有问题](https://www.ithome.com/0/953/652.htm "雷军回应只公布锁单数据:去年小米 YU7 三分钟大定超过 20 万辆,行业没有人信,觉得数据有问题")
  • [“死了么”App 被“收编”:改名“在么在么”,用于独居、空巢老人监测](https://www.ithome.com/0/954/638.htm "“死了么”App 被“收编”:改名“在么在么”,用于独居、空巢老人监测")
  • [B站大会员年卡买一得二:赠 WPS 超级会员 156 元,赠京东 PLUS 会员 148 元预售](https://www.ithome.com/0/953/115.htm "B站大会员年卡买一得二:赠 WPS 超级会员 156 元,赠京东 PLUS 会员 148 元预售")
  • [雷军:小米 YU7 GT 为时代精英设计,肯定会有点小贵](https://www.ithome.com/0/952/780.htm "雷军:小米 YU7 GT 为时代精英设计,肯定会有点小贵")
  • [618 预热大促 16 日继续:小米 15 Ultra 立打 6 折享 12 期免息,30 秒速读首发期攻略](https://www.ithome.com/0/949/525.htm "618 预热大促 16 日继续:小米 15 Ultra 立打 6 折享 12 期免息,30 秒速读首发期攻略")
  • [武汉大学就 OPPO 母亲节文案发声:极不认同内容表述和价值倾向](https://www.ithome.com/0/948/487.htm "武汉大学就 OPPO 母亲节文案发声:极不认同内容表述和价值倾向")
  • [618 预热大促 520 小高潮开启:华为 MatePad Mini 悦读版 2058 元,30 秒速读攻略](https://www.ithome.com/0/951/577.htm "618 预热大促 520 小高潮开启:华为 MatePad Mini 悦读版 2058 元,30 秒速读攻略")
  • [OPPO 就母亲节文案事件发布问责通告,中国区业务负责人段要辉职级直降两级](https://www.ithome.com/0/948/677.htm "OPPO 就母亲节文案事件发布问责通告,中国区业务负责人段要辉职级直降两级")
  • [小米 MIX 5 手机曝光:真全面屏回归、磁吸镜头技术,登陆全球市场](https://www.ithome.com/0/946/089.htm "小米 MIX 5 手机曝光:真全面屏回归、磁吸镜头技术,登陆全球市场")
  • [IT之家,十五岁~](https://www.ithome.com/0/950/954.htm "IT之家,十五岁~")
  • [小米首款增程全尺寸 SUV 低伪装路试谍照曝光:前大灯组造型锐利、车头可见激光雷达凸起](https://www.ithome.com/0/946/462.htm "小米首款增程全尺寸 SUV 低伪装路试谍照曝光:前大灯组造型锐利、车头可见激光雷达凸起")
  • [小米 17 Max 手机发布:8000mAh 电池、2 亿像素徕卡主摄,国补到手价 4299 元起](https://www.ithome.com/0/953/605.htm "小米 17 Max 手机发布:8000mAh 电池、2 亿像素徕卡主摄,国补到手价 4299 元起")
  • [小米 YU7 GT 正式发布:38.99 万元起,“大满配”42.99 万元](https://www.ithome.com/0/953/623.htm "小米 YU7 GT 正式发布:38.99 万元起,“大满配”42.99 万元")
  • [iPhone 17 Pro Max 换新低至 7999 元:苹果 618 零点开启,17 系列至高直降千元](https://www.ithome.com/0/950/631.htm "iPhone 17 Pro Max 换新低至 7999 元:苹果 618 零点开启,17 系列至高直降千元")
  • [特斯拉监督版 FSD 官宣登陆中国](https://www.ithome.com/0/953/120.htm "特斯拉监督版 FSD 官宣登陆中国")
  • [追觅 CEO 俞浩发文炮轰小红书“非常非常烂”:价值观和盈利模式都有毒,纯靠激发人性中的阴暗面来获取流量](https://www.ithome.com/0/943/729.htm "追觅 CEO 俞浩发文炮轰小红书“非常非常烂”:价值观和盈利模式都有毒,纯靠激发人性中的阴暗面来获取流量")
  • ### 人工智能最热文章
  • ![Image 12: 宇树发布全球首款量产版载人机甲 GD01:可变形,售价 390 万元起](https://www.ithome.com/0/949/213.htm)[宇树发布全球首款量产版载人机甲 GD01:可变形,售价 390 万元起](https://www.ithome.com/0/949/213.htm "宇树发布全球首款量产版载人机甲 GD01:可变形,售价 390 万元起")
  • ![Image 13: 中国电信推出试商用 Token 套餐,最低每月 9.9 元](https://www.ithome.com/0/951/532.htm)[中国电信推出试商用 Token 套餐,最低每月 9.9 元](https://www.ithome.com/0/951/532.htm "中国电信推出试商用 Token 套餐,最低每月 9.9 元")
  • [阿里千问最强智能体模型 Qwen3.7-Max 发布](https://www.ithome.com/0/952/670.htm "阿里千问最强智能体模型 Qwen3.7-Max 发布")
  • [DeepSeek-V4-Pro API 宣布永久降价,调整为原定价的 1/4](https://www.ithome.com/0/954/188.htm "DeepSeek-V4-Pro API 宣布永久降价,调整为原定价的 1/4")
  • [腾讯张军官宣操作系统层级 AI 助手“马维斯”正式上工,Windows、Mac、安卓端同步上线](https://www.ithome.com/0/953/096.htm "腾讯张军官宣操作系统层级 AI 助手“马维斯”正式上工,Windows、Mac、安卓端同步上线")
  • [腾讯马化腾称一年前以为上了 AI 的船结果发现漏水了,现在站上去但还坐不下去](https://www.ithome.com/0/949/906.htm "腾讯马化腾称一年前以为上了 AI 的船结果发现漏水了,现在站上去但还坐不下去")
  • [阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI](https://www.ithome.com/0/952/041.htm "阿里云千问大模型 Qwen3.7-Max-Preview 首发亮相 Arena AI")
  • [腾讯 AI 设计智能体 Ardot 公测:一句话生成可编辑设计稿,一键转代码](https://www.ithome.com/0/951/677.htm "腾讯 AI 设计智能体 Ardot 公测:一句话生成可编辑设计稿,一键转代码")
  • [DeepSeek API 完成输出提速与服务扩容,默认支持 500 并发同时在线](https://www.ithome.com/0/954/427.htm "DeepSeek API 完成输出提速与服务扩容,默认支持 500 并发同时在线")
  • [“让 Token 消耗降低 61%”:腾讯开源 Agent Memory](https://www.ithome.com/0/950/415.htm "“让 Token 消耗降低 61%”:腾讯开源 Agent Memory")
  • [马斯克邀你体验 Cursor 最强 AI 模型:Composer 2.5 登场,基于 Kimi K2.5 打造](https://www.ithome.com/0/952/106.htm "马斯克邀你体验 Cursor 最强 AI 模型:Composer 2.5 登场,基于 Kimi K2.5 打造")
  • [Linux 之父 Linus 发飙:别用 AI 提交大量重复 Bug 报告,直接提修复方案,OK?](https://www.ithome.com/0/951/682.htm "Linux 之父 Linus 发飙:别用 AI 提交大量重复 Bug 报告,直接提修复方案,OK?")

软媒旗下网站:IT之家最会买 - 返利返现优惠券iPhone之家Win7之家Win10之家Win11之家

软媒旗下软件:软媒手机APP应用魔方最会买要知

关于IT之家 |联系我们 |加入软媒 |WAP版 |网站地图 |Archiver

IT之家,软媒旗下科技门户网站 - 爱科技,爱这里。

Copyright © RuanMei.com, All Rights Reserved.

青岛软媒网络科技有限公司版权所有

AI 可能会生成不准确的信息,请核实重要内容