Baz 如何利用 Amazon Bedrock AgentCore 提升 AI 代码审查准确性

AWS Machine Learning Blog

AWS Machine Learning Blog2026年6月2日

Baz 如何利用 Amazon Bedrock AgentCore 提升 AI 代码审查准确性

8.5Score

TL;DR · AI 摘要

Baz 使用 Amazon Bedrock AgentCore 构建 AI 代码审查代理，实现从设计到行为的端到端自动化验证，准确率提升显著。

核心要点

Baz 通过 Amazon Bedrock AgentCore 实现 UI 动态验证，覆盖静态代码检查无法触及的视觉与行为一致性。
系统集成 Figma 和 Jira 数据，将产品需求转化为可执行的子代理任务，提升验收效率。
基于 AWS EKS 和 ALB 的架构支持高并发、低延迟的自动化评审流程，降低人工依赖。

结构提纲

按章节快速跳转。

§背景与痛点
传统代码审查仅关注语法和编译，无法验证功能与设计意图是否一致，导致交付延迟和回归风险。
§解决方案架构
Baz 构建多阶段代理系统，整合 Figma、Jira 数据，并通过 Amazon Bedrock AgentCore 实现动态 UI 验证。
§技术实现细节
使用 EKS 集群部署代理，每个需求由独立子代理处理，结合源码分析与浏览器工具进行端到端验证。
§业务成果
自动化流程显著减少人工 QA 工作量，提升交付速度并确保设计意图与实现的一致性。

思维导图

用一张图看清主题之间的关系。

查看大纲文本（无障碍 / 无 JS 友好）

Baz AI 代码审查自动化方案
- 核心架构
  - 多阶段代理系统
  - Figma/Jira 数据集成
- 关键技术
  - Amazon Bedrock AgentCore
  - EKS + ALB 部署
- 业务价值
  - 减少人工 QA
  - 提升交付一致性

金句 / Highlights

值得收藏与分享的关键句。

Baz 的 Spec Review Agent 能同时查询 Figma 和 Jira，将设计规范与功能需求拆解为可执行的子任务。
— Solution overview
⬇︎ 下载 PNG 𝕏 分享到 X
Implementation Subagents 利用 Amazon Bedrock AgentCore Browser Tool 在临时环境中渲染并验证 UI 是否匹配 Figma 设计。
— Technical Implementation
⬇︎ 下载 PNG 𝕏 分享到 X
整个系统通过 AWS EKS + ALB 实现高并发、低延迟的自动化评审，支持大规模团队协作。
— Architecture Overview
⬇︎ 下载 PNG 𝕏 分享到 X

#Amazon Bedrock#AI Agent#Code Review#AWS

打开原文

代码审查过去一直是手动且低效的，因为代码与产品之间存在固有的脱节。开发者可以检查代码是否能编译和运行，但无法判断其是否满足所有功能性和设计要求。过去，QA团队需要花费数小时手动点击预览环境以确保功能表现符合预期，甚至更多时间用于将实现与设计意图对齐。这种手动验证减缓了交付速度，引入了不一致性，并增加了回归风险。随着开发团队节奏的加快，Baz希望自动化这一缺失的验证环节，将意图、行为和实现整合到单一的审查工作流中。

本文将介绍Baz如何利用Amazon Bedrock和Amazon Bedrock AgentCore构建其规范审查代理。我们将涵盖架构决策、实施细节以及通过利用这些AWS服务自动化代码审查流程所取得的业务成果。

Baz试图解决的关键问题

Baz旨在超越传统的仅基于差异对比的审查方式，转向验证功能是否满足其预期的产品需求。早期，Baz发现团队在审查过程中往往关注语法而非行为，导致诸如“它是否有效”、“是否符合规格”、“是否按预期行为”等关键问题只能在流程后期手动解答。这种代码与产品意图之间的差距拖慢了团队效率，造成了设计不一致，并迫使团队依赖大量未文档化的内部QA知识。Baz的目标是通过构建能够评估不仅是代码本身，还能评估实际交付体验的代理来弥合这一差距。

解决方案概述

Baz规范审查代理协调一个复杂的多阶段验证流水线：当触发（通过Webhook或手动调用）时，它会同时通过MCP查询Figma并通过REST API查询Jira，以聚合涵盖技术、产品和设计规范的全面需求工件。系统随后启动隔离的子代理工作者（每个需求一个），负责验证该需求。该子代理结合源代码仓库中的代码检查与使用Amazon Bedrock AgentCore浏览器工具进行的动态运行时验证。子代理与临时环境交互，执行DOM检查、事件模拟和视觉测试，以确保部署的实现既符合Figma设计规范，又满足行为性要求，从而通过AWS原生编排实现从规范到实现全生命周期的端到端验证。

下图展示了由Baz与AWS联合开发的规范审查器架构，该架构可在您的代码审查流程内实现自动化设计与产品验证。整个代理流程由通过Amazon Bedrock提供的大型语言模型驱动，为整个管道提供可扩展且安全的AI推理能力。流程始于GitHub Webhook触发新拉取请求，流量经由应用负载均衡器（ALB）和网络负载均衡器（NLB）进入Amazon EKS集群。Baz平台作为中央编排层，协调多代理审查过程。

在Amazon EKS集群内，Baz的规范审查代理将验证工作流分解为专门的子代理。规范子代理由Amazon Bedrock驱动，摄入来自Figma的视觉规范和来自Jira的功能规范，然后将其分解为离散的需求——视觉需求（如间距、颜色和组件层级）和功能需求（如验收标准和用户故事意图）。

实现子代理是此架构的核心。这些由Amazon Bedrock驱动的代理对提取的规范进行深度代码分析，但其独特之处在于与Amazon Bedrock AgentCore浏览器使用能力的集成。它们不仅依赖静态代码分析，还能在实时预览环境中渲染实际实现，并通过视觉验证UI是否匹配预期的Figma设计，以及功能是否符合Jira中指定的行为。这种代码理解与基于浏览器的验证相结合，使Baz能够捕捉传统代码审查工具完全忽略的差异。

报告生成器将所有子代理的发现汇总成连贯的审查摘要。审查完成后，结果将分发至相应渠道：评论直接发布到GitHub PR，通知发送至Slack以便团队可见，识别出的问题可自动链接回Jira以便跟踪和解决。

Baz如何利用Amazon Bedrock AgentCore应对这些挑战

Amazon Bedrock AgentCore 成为了构建能够验证真实产品行为的 AI 代码审查器的基础。其安全、隔离且无服务器的浏览器会话，使 Spec Reviewer 代理能够打开预览环境、浏览功能并检查 UI 行为，完全模拟用户操作。通过结合 Amazon Bedrock AgentCore 运行时来运行与工单系统集成的 MCP 服务器，以及 Amazon Bedrock AgentCore 浏览器工具搭配轻量级自动化和上下文模块，Baz Reviewer 可以在无需任何浏览器基础设施或自定义编排的情况下，将实时行为与代码与工单和设计规范进行比对。Amazon Bedrock AgentCore 的隔离、沙箱机制和可观测性有助于 Baz 同时扩展多个 MCP 服务器，并允许代理安全可靠地在大规模上执行全栈验证。

使用 Amazon Bedrock 实现智能代码审查

Amazon Bedrock 为 Spec Reviewer 代理提供推理与决策层能力，使其能够理解需求、把握设计意图，并评估浏览器中观察到的行为是否符合预期。借助 Amazon Bedrock 管理的基础模型，该代理可以综合规范上下文、分析 UI 状态，并精准生成可操作的结论，判断某项功能是否满足期望。Amazon Bedrock 提供了生产级代理工作流所需的可靠性、安全性与扩展能力，使 Baz 能够将复杂的解释与验证逻辑卸载至高性能 LLM，同时保持浏览器执行在 AgentCore 内部隔离。这种组合使审查者能够弥合“设计意图”与“实际实现”之间的差距。

结论

Baz Spec Review 代理展示了 Amazon Bedrock 和 Amazon Bedrock AgentCore 如何帮助组织自动化此前需大量人工投入的产品验证流程。通过利用 Amazon Bedrock 基础模型进行需求解读与决策，结合 AgentCore 安全的浏览器自动化能力，Baz 创建了一种解决方案，可在整个开发生命周期内验证实现是否符合规范，从而将报告的缺陷减少高达 50%，合并代码的时间缩短 30–70%。

采用 Spec Reviewer 的客户显著减少了手动产品验证工作，功能验证得以更早介入开发周期，并在拉取请求时自动完成。团队反馈称审查速度更快、回归问题更少，且对变更是否满足需求的信心更高。

* *

Baz 如何利用 Amazon Bedrock AgentCore 提升 AI 代码审查准确性

TL;DR · AI 摘要

核心要点

结构提纲

思维导图

金句 / Highlights

Baz试图解决的关键问题

解决方案概述

Baz如何利用Amazon Bedrock AgentCore应对这些挑战

使用 Amazon Bedrock 实现智能代码审查

结论

关于作者