模型

Gemma4-31B

traeai 已收录 2 篇与 Gemma4-31B 相关的内容。最新一篇是「The Infrastructure Behind Making Local LLM Agents Actually Useful」，由 Towards Data Science 发布。

别名：Gemma 4

Google发布的开源大模型，支持复杂指令与工具调用。

已跟踪 2 条高相关材料

TraeAI 观察

The Infrastructure Behind Making Local LLM Agents Actually Useful

Towards Data Science · 8.5 分

本地部署大语言模型代理需解决推理速度与长会话状态管理问题，通过优化vLLM服务器和结构化世界状态，可将单次调用耗时从15秒降至2秒以内，支持科学工作流的可复现性需求。

Some models to try with Codex: kimi-k2.6:cloud (with vision support) glm-5.1:cloud If you don't ye...

ollama(@ollama) · 6.5 分

Ollama 推荐了多个与 Codex 配合使用的模型，包括支持视觉的 kimi-k2.6 和 glm-5.1。

Towards Data Science5月28日4379 字 (约 18 分钟)

本地部署LLM代理需解决推理速度与长会话状态管理问题，通过优化vLLM服务器和结构化世界状态，可将单次调用耗时从15秒降至2秒以内，支持科学工作流的可复现性需求。

入选理由：使用vLLM优化推理性能，单次调用耗时从15秒降至2秒内

精选文章#LLM#Agent#Inference#HPC#Open Source英文

ollama(@ollama)5月15日175 字 (约 1 分钟)

Ollama 推荐了多个与 Codex 配合使用的模型，包括支持视觉的 kimi-k2.6 和 glm-5.1。

入选理由：kimi-k2.6 支持视觉功能，适合图像相关任务。

精选推文#Codex#AI 模型#Ollama英文

回答基于：Gemma4-31B 相关 2 条材料