T
traeai
登录

模型

Gemini embedding 2

别名:Gemini Embedding 2

Google 发布的多模态嵌入模型,支持视频等非文本数据向量化。

已跟踪 8 条高相关材料

TraeAI 观察

相关材料

已收录 8 条与 Gemini embedding 2 相关的内容,按评分排序。

Google Developers Blog 图标

Building with Gemini Embedding 2: Agentic multimodal RAG and beyond

Google Developers Blog1094 字 (约 5 分钟)
85

Google宣布Gemini Embedding 2正式可用,该模型支持文本、图像、视频、音频和文档的统一嵌入,实现100多种语言的跨模态搜索与应用,如增强型多模态RAG、视觉搜索等。

入选理由:Gemini Embedding 2是首个通过单一接口处理多样输入并映射至同一语义空间的模型,支持多模态数据理解。

精选文章#Google#Gemini Embedding 2#多模态搜索#RAG#AI中文
The Gemini API's File Search tool now supports multimodal retrieval. Use `gemini-embedding-2` as the...

Gemini API 的文件搜索工具现已支持多模态检索

Philipp Schmid(@_philschmid)349 字 (约 2 分钟)
78

Gemini API 的文件搜索工具现已支持多模态检索,使用 `gemini-embedding-2` 模型可构建统一处理 PDF 和图像的 RAG 系统,索引与查询分离计费,存储和查询嵌入免费。

入选理由:Gemini 新增多模态文件检索能力,支持 PDF 与图像混合检索。

精选推文#Gemini#RAG#多模态检索#Google DeepMind英文
Last week, we made Gemini Embedding 2, our first natively multimodal embedding model, available to t...

Google 推出 Gemini Embedding 2:首个原生多模态嵌入模型

Google AI(@GoogleAI)284 字 (约 2 分钟)
78

Google 推出首个原生多模态嵌入模型,可将文本、图像、视频、音频统一映射为语义向量,支持跨模态语义搜索,已开放公测并用于视频分析、视觉购物等场景。

入选理由:Gemini Embedding 2 是首个原生多模态嵌入模型,支持文本、图像、视频、音频统一编码。

精选推文#Gemini Embedding 2#多模态嵌入#语义搜索#AI模型#Google英文
Stop treating video like text.

You don’t need transcripts.
You don’t need metadata.

You can now em...

停止像对待文本一样处理视频

Weaviate • vector database(@weaviate_io)141 字 (约 1 分钟)
75

视频搜索不再依赖转录文本或元数据,可直接通过多模态模型嵌入视频片段进行检索。

入选理由:使用 Gemini embedding 2 多模态模型直接嵌入视频片段。

精选推文#Weaviate#多模态AI#向量搜索#视频检索#Gemini英文

跨材料问答 · Gemini embedding 2

回答基于:Gemini embedding 2 相关 8 条材料
    0 / 500

    AI 可能会生成不准确的信息,请核实重要内容