使用 Amazon Nova 2 Lite 进行物体检测

TL;DR · AI 摘要
Amazon Nova 2 Lite 提供无需训练的物体检测解决方案,通过自然语言提示即可实现对象识别与定位。
核心要点
- Amazon Nova 2 Lite 可在无模型训练的情况下,通过自然语言提示进行物体检测。
- 每处理 10,000 张图像的成本约为 $5.69,使用 AWS Lambda 和 API Gateway 的成本极低。
- 解决方案包括提示工程、调用 Amazon Bedrock、坐标处理和可视化四个步骤。
结构提纲
按章节快速跳转。
- §引言
传统计算机视觉方案需要大量前期投资,Amazon Nova 2 Lite 提供了一种无需训练的替代方案,通过自然语言提示即可实现物体检测。
文章介绍了使用 Amazon Bedrock、Lambda 和 API Gateway 实现物体检测应用的部署流程,包括提示工程、坐标处理和可视化。
- ·前提条件
需要 AWS 账户权限、开发环境(Python、Boto3、Pillow)以及 AWS CLI 配置。
- ·实施步骤
包括提示工程、调用 Amazon Bedrock 获取边界框信息、将归一化坐标转换为像素位置、以及可视化结果。
- ·成本估算
每处理 10,000 张图像的成本约为 $5.69,使用 AWS Lambda 和 API Gateway 的成本极低。
思维导图
用一张图看清主题之间的关系。
查看大纲文本(无障碍 / 无 JS 友好)
- Amazon Nova 2 Lite 物体检测
- 解决方案优势
- 无需训练
- 低成本
- 快速部署
- 实施步骤
- 提示工程
- 调用 Amazon Bedrock
- 坐标处理
- 可视化
- 应用场景
- 制造
- 农业
- 物流
金句 / Highlights
值得收藏与分享的关键句。
Amazon Nova 2 Lite 可在无模型训练的情况下,通过自然语言提示进行物体检测。
每处理 10,000 张图像的成本约为 $5.69,使用 AWS Lambda 和 API Gateway 的成本极低。
解决方案包括提示工程、调用 Amazon Bedrock、坐标处理和可视化四个步骤。
使用 Amazon Nova 2 Lite 进行目标检测 | 亚马逊网络服务
发布时间:2026-06-02T09:31:11-08:00
Markdown 内容:
传统的计算机视觉解决方案可能需要大量的前期投资。设置数据管道、模型训练基础设施、计算资源以及一个专门的数据科学团队,对于小公司或团队来说往往是难以承受的。Amazon Nova 2 Lite 是通过 Amazon Bedrock 提供的一种吸引人的替代方案。这个多模态基础模型可以通过自然语言提示检测对象,无需进行任何训练。指定“车辆”、“人员”或“凹痕”,Nova 将以结构化的 JSON 格式返回精确的边界框坐标。
在本文中,我们将逐步介绍如何使用 Amazon Nova 2 Lite 实现目标检测。您将学习如何利用 Amazon Bedrock、AWS Lambda 和 Amazon API Gateway 部署目标检测应用程序。您还将学习如何编写有效的提示词,处理结构化的 JSON 输出,并可视化结果。我们探讨了在制造、农业和物流等领域的实际应用。
解决方案概述
在开始之前,请确保您具备以下条件:
AWS 账户及权限
- 激活的 AWS 账户并启用了 Amazon Bedrock 访问权限
bedrock:InvokeModel的 IAM 权限- 在您的区域访问 Amazon Nova 2 Lite 模型
- 配置好的 AWS 命令行界面 (AWS CLI)(用于部署)
开发环境(用于本地测试)
- Python 3.8 或更高版本
- AWS SDK for Python (Boto3) 版本 1.28.0+
- Python Imaging Library (PIL/Pillow)
安装:
pip install boto3 pillow预计成本
- Amazon Bedrock:每千个输入令牌 $0.0003,每千个输出令牌 $0.0025
- 典型图像:230 个输入令牌(约 $0.000069/张)& 约 200 个输出令牌(约 $0.0005/张)
- 示例:10,000 张图像 ≈ $5.69
- AWS Lambda、Amazon API Gateway:按需付费(测试时费用极低)
时间估算: 30-45 分钟
目标检测解决方案通过四个主要步骤来识别和定位图像中的对象。
步骤:
- 提示工程 – 结构化提示以指定对象和期望的 JSON 输出格式
- Amazon Bedrock – 调用 Amazon Bedrock 以访问 Amazon Nova 2 Lite,而无需管理基础设施,并从响应中提取边界框信息
- 坐标处理 – 将 Nova 的归一化坐标(0-1000 范围) 转换为像素位置
- 可视化 – 在图像上绘制边界框以进行验证
您通过 Amazon Bedrock 的 Converse API 发送图像和要检测的对象列表。Amazon Nova 2 Lite 分析图像并返回一个 JSON 响应,其中包含每个检测到对象的边界框坐标。然后,您根据图像尺寸将归一化坐标(0-1000 范围)转换为像素位置。最后,您通过在原始图像上绘制边界框来可视化结果。
只需数小时即可部署目标检测功能——无需模型训练、机器学习 (ML) 专业知识或基础设施管理。
提示词
提示工程在实现准确检测方面起着重要作用。提示模板(如下例所示)包含精心设计的指令集,指定了关键要求。提示模板中的两个变量:elements 和 schema 是根据检测到的对象类型动态构建的,使得提示模板能够处理任意对象类别而无需修改。
# 对象检测与定位
## 目标
您的任务是在目标图像中高精度和高召回率地检测和定位对象。
## 指令
- 要检测的对象是:{elements}
- 分析提供的目标图像,并仅返回推理过程和一个包含检测对象边界框数据的 JSON 对象
- 逐步思考,然后为每个检测结果提供精确的边界框坐标
- 检测所有指定对象的实例
- 将边界框紧密地围绕每个对象
- 不要输出重复的边界框
- 坐标应使用以下格式 [x_min, y_min, x_max, y_max]:
* (x_min, y_min) 是边界框的左上角
* (x_max, y_max) 是边界框的右下角
## 输出要求与示例
JSON 输出必须严格遵循以下结构,包括单词 json:
{schema}
### 示例 JSON 结构:
{{ "car": [{{ "bbox": [321, 432, 543, 876], }}], "pedestrian": [{{ "bbox": [432, 543, 654, 987], }}, {{ "bbox": [123, 234, 345, 678], }}], // 继续为所有检测到的元素... }}
简要解释检测结果,并提供指定的 JSON 格式,用三重反引号包裹。有关完整实现细节,请参阅我们的 GitHub 仓库。
示例:街道场景检测
我们在一张街道场景图像上测试了 Nova 2 Lite。无需任何训练或微调,我们要求 Nova 检测两种对象类型:“车辆”和“停车标志”。
如图 1 所示,Nova 不仅准确检测了明显的对象,还检测了那些较小、较远或部分被遮挡的对象。边界框紧密地贴合对象边界,几乎没有间隙。Nova 仅使用像“车辆”和“停车标志”这样的基本对象名称,无需详细描述,就能实现这种准确性。
以上是翻译后的 Markdown 文档,保持了原始格式和内容的一致性。
_
图 1. Amazon Nova 2 Lite 为两种对象类型生成的边界框:“车辆”和“停车标志”。_
在云端部署
Amazon Bedrock 提供对 Amazon Nova 2 Lite 的 API 访问权限,这意味着您可以从任何 AWS 计算服务调用它。选择最适合您工作负载的服务。
选择您的计算平台
对于事件驱动型工作负载和 API 端点,AWS Lambda 提供自动扩展功能,并采用按调用付费的模式,消除了闲置成本。如果您需要对运行时环境有更多控制权,或者有长时间运行的任务,Amazon Elastic Compute Cloud (Amazon EC2) 可为您提供完全的灵活性,可以根据需求精确配置实例。对于基于容器的部署并带有自动扩展功能,可以使用 Amazon Elastic Container Service (Amazon ECS) 或 Amazon Elastic Kubernetes Service (Amazon EKS)。
无论您选择哪种计算服务,它们都会调用相同的 Amazon Bedrock Converse API 来与 Nova 模型交互。这种一致性使得将对象检测集成到现有基础设施中变得非常简单,或者在需求演变时轻松迁移计算平台。
构建一个对象检测应用程序
我们构建了一个示例无服务器 Web 应用程序,展示了使用 Amazon Nova 2 Lite 进行对象检测的功能。这个概念验证包括一个 Web 界面、安全的基础设施以及自动扩展功能。您可以在几分钟内将其部署到自己的 AWS 账户中。
该应用程序遵循无服务器优先架构,利用多个 AWS 服务协同工作。Amazon CloudFront 从私有的 Amazon Simple Storage Service (Amazon S3) 存储桶中提供单页应用程序,通过 Origin Access Control 提供全球分发和 HTTPS 强制执行。当用户上传图像并指定要检测的对象时,前端会将请求发送到 Amazon API Gateway,该请求会被路由到 AWS Lambda 函数。
Lambda 函数充当编排层,调用 Amazon Bedrock 的 Converse API 将图像和检测提示发送给 Amazon Nova 2 Lite。Nova 返回每个检测到的对象的归一化边界框坐标,Lambda 函数将这些坐标转换为像素位置,并在图像上渲染带注释的边界框。标注结果会沿着相同的路径返回:Lambda 到 API Gateway 到前端。用户最终看到的是带有检测到的对象高亮显示的图像。
Amazon CloudFront 全球分发前端。API Gateway 将请求路由到 Lambda,Lambda 调用 Amazon Bedrock 执行对象检测。这种架构自动扩展,并使每个组件专注于单一任务。
_
图 2. 无服务器对象检测示例应用程序架构_
自己动手试试
完整的源代码(包括所有 AWS Cloud Development Kit (AWS CDK) 基础设施定义和 Lambda 函数)可在 GitHub 仓库 中找到。安装 AWS CLI 和 AWS CDK 并在 Amazon Bedrock 控制台中启用 Amazon Nova 2 Lite 访问权限后,部署过程非常简单。
这种无服务器模式展示了如何快速使用 Nova 模型构建 AI 应用程序。由于它是全基础设施即代码,您可以对整个应用程序堆栈进行版本控制,并一致地部署到多个环境或 AWS 账户中。
清理资源
为了避免持续收费,请删除本教程中创建的所有资源。
如果您部署了示例应用程序:
# 删除 AWS CloudFormation 堆栈
cdk destroy
# 验证资源已删除
aws cloudformation list-stacks --stack-status-filter DELETE_COMPLETE手动清理(如需):
- 删除 Amazon S3 存储桶及其内容
- 删除 AWS Lambda 函数
- 删除 Amazon API Gateway 端点
- 删除 Amazon CloudFront 分发
费用影响: Amazon Bedrock API 调用是按使用量付费,没有持续的基础设施成本。一旦删除部署资源,您只需在调用 API 时产生费用。
实际应用
以下示例展示了 Amazon Nova 2 Lite 如何应用于跨行业的实际应用场景。
制造业质量控制
一家金属制造厂每月处理 10,000 个零件。每个发货的缺陷零件会导致 $50-200 的退货和返工成本。训练传统计算机视觉模型所需的高昂前期投资通常对其运营来说是难以承受的。
借助 Amazon Nova 2 Lite,工厂实现了质量检测的自动化。他们可以指定缺陷类型,例如“划痕”、“凹痕”或“锈斑”,系统会自动识别这些缺陷。分析每个零件的 5 张图像每月大约花费 $8。
精准农业
一个占地 5,000 英亩的农场在 20 周的生长季节每周拍摄无人机图像,以尽早发现作物问题。早期检测可以防止化学品过度使用和作物受损。
农场指定了以下内容:“病叶”、“虫害”、“真菌”。每季处理 120 万张高分辨率图像的成本约为 $200。
同样的方法使得GPS引导的设备能够检测障碍物(例如,“车辆”、“设备”、“碎片”),这可能允许自主的现场操作。
物流与履行
配送中心通过指定“破损的箱子”、“压坏的包裹”、“水损”来识别受损的包裹。系统自动标记需要检查的物品,并将其路由到质量控制区域,确保运营中的标准一致性。
这种方法还扩展到库存监控(例如,“空货架”、“错放的物品”)和安全合规性(例如,“安全帽”、“安全背心”、“安全眼镜”),使计算机视觉适用于任何规模的运营。
结论
在这篇文章中,我们展示了Amazon Nova 2 Lite如何使对象检测变得易于使用。通过自然语言提示指定对象名称,您可以在几小时内而不是几个月内部署计算机视觉应用程序,而无需管理任何基础设施。它通过单一API提供对象检测性能,采用按需付费的成本结构,并且不需要机器学习(ML)专业知识。
准备好尝试了吗?从我们的GitHub仓库部署示例应用程序,或在Amazon Bedrock 控制台中探索Amazon Nova模型。
- * *