多向量模型部署后结果反而更差？罪魁祸首是评分机制不匹配

Milvus(@milvusio)

Milvus(@milvusio)2026年5月8日

多向量模型部署后结果反而更差？罪魁祸首是评分机制不匹配

7.8Score

TL;DR · AI 摘要

多向量模型部署后表现不如密集检索，主因是打分逻辑与检索系统不一致。

核心要点

多向量模型结果常劣于密集检索，因评分机制与向量匹配不一致。
90% 的性能问题源于模型打分逻辑与检索系统设计的不匹配。
应统一打分策略以对齐多向量模型与检索引擎的行为

结构提纲

按章节快速跳转。

§问题现象
团队在部署多向量模型后，检索结果反而比传统密集检索更差。
·根本原因
多向量模型的文档打分方式与检索系统预期不一致。
›常见错误
未对齐多向量模型的分数归一化与检索系统的相似度计算逻辑。
·解决方案建议
需统一打分流程，确保模型输出与检索系统兼容。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

多向量模型检索性能下降原因
- 问题现象
  - 结果劣于密集检索
  - 部署后性能反降
- 根本原因
  - 评分机制不匹配
  - 打分逻辑与检索系统脱节
- 解决方案
  - 统一打分标准
  - 对齐分数分布

金句 / Highlights

值得收藏与分享的关键句。

多向量模型的结果常常比纯密集检索还差，罪魁祸首几乎总是评分机制与检索系统之间的不匹配。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
90% 的性能退化案例都源于多向量模型的打分逻辑与向量数据库的相似度计算方式不一致。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X
必须重新校准多向量模型的输出分数，使其符合检索系统对相似度的期望分布。
— 第 1 段
⬇︎ 下载 PNG 𝕏 分享到 X

#Milvus#多向量检索#向量数据库#RAG#AI 检索

打开原文

𝗧𝗵𝗲 𝗰𝘂𝗹𝗽𝗿𝗶𝘁 𝗶𝘀 𝗮𝗹𝗺𝗼𝘀𝘁 𝗮𝗹𝘄𝗮𝘆𝘀 𝗮 𝗺𝗶𝘀𝗺𝗮𝘁𝗰𝗵 𝗯𝗲𝘁𝘄𝗲𝗲𝗻 𝗵𝗼𝘄 𝗺𝘂𝗹𝘁𝗶-𝘃𝗲𝗰𝘁𝗼𝗿 𝗺𝗼𝗱𝗲𝗹𝘀 𝘀𝗰𝗼𝗿𝗲 𝗱𝗼𝗰𝘂𝗺𝗲𝗻𝘁𝘀 𝗮𝗻𝗱 https://t.co/5urk3Rifkv" / X

Milvus on X: "Sometimes, when teams deploy a multi-vector model, their results come back worse than plain dense retrieval. 𝗧𝗵𝗲 𝗰𝘂𝗹𝗽𝗿𝗶𝘁 𝗶𝘀 𝗮𝗹𝗺𝗼𝘀𝘁 𝗮𝗹𝘄𝗮𝘆𝘀 𝗮 𝗺𝗶𝘀𝗺𝗮𝘁𝗰𝗵 𝗯𝗲𝘁𝘄𝗲𝗲𝗻 𝗵𝗼𝘄 𝗺𝘂𝗹𝘁𝗶-𝘃𝗲𝗰𝘁𝗼𝗿 𝗺𝗼𝗱𝗲𝗹𝘀 𝘀𝗰𝗼𝗿𝗲 𝗱𝗼𝗰𝘂𝗺𝗲𝗻𝘁𝘀 𝗮𝗻𝗱 https://t.co/5urk3Rifkv" / X

Don’t miss what’s happening

Milvus

@milvusio

Sometimes, when teams deploy a multi-vector model, their results come back worse than plain dense retrieval. 𝗧𝗵𝗲 𝗰𝘂𝗹𝗽𝗿𝗶𝘁 𝗶𝘀 𝗮𝗹𝗺𝗼𝘀𝘁 𝗮𝗹𝘄𝗮𝘆𝘀 𝗮 𝗺𝗶𝘀𝗺𝗮𝘁𝗰𝗵 𝗯𝗲𝘁𝘄𝗲𝗲𝗻 𝗵𝗼𝘄 𝗺𝘂𝗹𝘁𝗶-𝘃𝗲𝗰𝘁𝗼𝗿 𝗺𝗼𝗱𝗲𝗹𝘀 𝘀𝗰𝗼𝗿𝗲 𝗱𝗼𝗰𝘂𝗺𝗲𝗻𝘁𝘀 𝗮𝗻𝗱

3:08 PM · May 8, 2026

1