将 600 亿参数大模型装进手机的瓶颈,终于被中国 AI 公司突破了
爱范儿2653 字 (约 11 分钟)
92
中国AI公司突破三值量化技术,使600亿参数模型可在手机运行,节省6倍显存且性能损失极小。
入选理由:三值量化可节省6倍显存,保留97%模型能力,支持在8GB内存手机运行600亿参数模型。
精选文章#AI模型#三值量化#昇腾芯片#端侧AI#模型压缩中文
模型
基于三值量化的端侧大模型系列。
已跟踪 2 条高相关材料
最近变化
2026-05-25 · 三值量化可节省6倍显存,保留97%模型能力,支持在8GB内存手机运行600亿参数模型。
为什么值得关注
BitCPM-CANN 被反复提及时,通常意味着它正在影响产品路线、开发者工作流或 AI 产业判断。这个页面把分散材料合并成一个可持续更新的观察入口。
已收录 2 条与 BitCPM-CANN 相关的内容,按评分排序。
中国AI公司突破三值量化技术,使600亿参数模型可在手机运行,节省6倍显存且性能损失极小。
入选理由:三值量化可节省6倍显存,保留97%模型能力,支持在8GB内存手机运行600亿参数模型。
面壁智能联合清华等发布中国首个基于华为昇腾训练的1.58-bit端侧大模型BitCPM-CANN,支持6倍显存压缩且性能保持90%以上。
入选理由:BitCPM-CANN是中国首个基于华为昇腾训练并开源的1.58-bit端侧大模型。