T
traeai
登录
返回首页
AWS Machine Learning Blog

利用 Amazon Quick 转变罕见癌症研究:整合生物医学数据库实现突破性发现

8.5Score
利用 Amazon Quick 转变罕见癌症研究:整合生物医学数据库实现突破性发现

TL;DR · AI 摘要

Amazon Quick Research 通过整合 PubMed 等生物医学数据库与 LLM 合成能力,将罕见癌症研究的数据集成周期从数周缩短至小时级,支持版本化修订与可追溯引用报告生成。

核心要点

  • 使用 Amazon Quick Research 可将多源异构生物医学数据(如 PubMed、ClinicalTrials.gov)的整合时间从数周压缩至数小时
  • 系统自动生成带引用追踪的结构化报告,每条结论附带‘理解该陈述’功能,展示证据链,提升科研可信度。
  • 支持版本化修订流程:用户可标注语句并提交修订,系统仅重跑标注部分,保留历史版本便于对比迭代。

结构提纲

按章节快速跳转。

  1. 罕见癌症研究需整合基因组、临床试验和文献等异构数据,传统ETL流程耗时数周,阻碍快速发现。

  2. ·Amazon Quick Research 核心能力

    该工具通过自然语言解析、多源数据摄入、AI生成计划、可追溯引用报告和版本化修订实现端到端自动化研究。

  3. Spaces 作为逻辑容器支持上传10,000+文件并自动索引,为研究提供内部知识库,兼容PDF/Excel/JSON等多种格式。

  4. 以儿童肉瘤为例,演示从创建Space、配置数据源、审查AI计划到生成报告及迭代修订的完整工作流。

  5. 报告可导出为PDF或Word,并提供执行摘要、通用版和定制版三种格式,适配不同受众需求。

思维导图

用一张图看清主题之间的关系。

查看大纲文本(无障碍 / 无 JS 友好)
  • Amazon Quick Research 在罕见癌症研究中的应用
    • 核心能力
      • 自然语言解析研究目标
      • 多源数据摄入与索引
      • AI生成可修订研究报告
    • 数据支撑层
      • Spaces 容器管理
      • 支持10K+文件格式
    • 实操价值
      • 从数周到数小时的效率跃升
      • 版本化迭代与证据链追溯

金句 / Highlights

值得收藏与分享的关键句。

  • 整合这些数据源通常需要定制ETL管道……整个过程可能在分析开始前就耗时数周。

    第 1 段

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 输出是带有内联引用的结构化报告,每个陈述包含来源链接,可追溯至原始文档或URL。

    Capabilities section

    ⬇︎ 下载 PNG𝕏 分享到 X
  • 用户可对特定语句添加修订注释……提交修订后系统仅重跑标注部分并递增版本号。

    Capabilities section

    ⬇︎ 下载 PNG𝕏 分享到 X
#Amazon Quick#LLM#生物医学数据#罕见癌症
打开原文

标题:利用 Amazon Quick 转变罕见癌症研究:整合生物医学数据库以实现突破性发现 | 亚马逊云科技

来源网址:https://aws.amazon.com/blogs/machine-learning/transforming-rare-cancer-research-with-amazon-quick-integrating-biomedical-databases-for-breakthrough-discoveries/

发布时间:2026-06-01T13:54:16-08:00

Markdown 内容: 罕见癌症研究在基因组测序流程、临床试验注册库、生物标志物存储库和同行评审文献中生成异构数据。将这些来源整合用于单一研究通常需要定制的 ETL 管道、手动模式协调,以及跨多个孤立系统的迭代查询——这一过程可能耗时数周才能开始任何分析。

Amazon Quick Research 通过提供统一的研究环境来应对这一集成挑战。它从多个来源摄取结构化和非结构化数据,包括公开可用的生物医学数据库如 PubMed,并应用大型语言模型(LLM)驱动的综合技术生成带引用、版本化的研究报告。

在本文中,我们将逐步演示如何使用 Amazon Quick Research 整合生物医学数据源以支持罕见癌症研究。本教程以儿童肉瘤为研究领域,并基于 PubMed 和其他开放生物医学存储库中的公开数据集。内容涵盖端到端工作流:定义研究目标、配置数据源、审查 AI 生成的研究计划、执行调查,以及使用修订与版本控制系统迭代结果。

功能特性

Amazon Quick Research 是 Amazon Quick 中的一个代理式研究工作流,可协调多源数据检索与基于 LLM 的综合分析。其核心组件包括:

  • 研究目标解析 – 代理将自然语言形式的研究问题解释为结构化子主题,以便并行开展调查。
  • 多源数据摄取 – 支持网络搜索(包括 PubMed、ClinicalTrials.gov 和开放获取期刊等公开索引资源)、文件上传(PDF、Word、Excel、PowerPoint)以及 Amazon Quick 资产(Spaces、仪表板、知识库和数据集)。数据源在创建研究项目时即被处理并建立索引。
  • AI 生成的研究计划 – 在运行前,代理会生成一份结构化计划,列出将要调查的主题、每个主题所查询的来源及分析方法。您可在提交完整运行前审查并修改该计划。
  • 带引用报告生成 – 输出为结构化报告,内含可追溯至原始文档或 URL 的内联引用。每条陈述均包含来源链接,“理解该陈述”功能可展示支撑个别结论的证据链。
  • 版本化修订工作流 – 您可对特定语句添加修订评论(最多 400 字符)。提交修订后,系统将启动仅针对标注部分的新一轮研究运行,版本号递增,并保留先前版本供对比。
  • 导出格式 – 报告可导出为 PDF 或 Word 格式。摘要变体(高管版、通用版、自定义版)允许您根据受众调整输出长度和引用密度。

**Spaces** 提供数据组织层,为 Amazon Quick Research 提供数据支持。Space 是一个逻辑容器,可将多达 10,000 个文件与 Amazon Quick 仪表板、主题和知识库组合在一起。文件上传后即被索引,作为研究运行的检索语料库。支持格式包括 Word、Excel、PowerPoint、PDF、CSV、TXT、RTF、JSON、YAML、XML 和 HTML。在本教程中,Space 将填充公开可用的癌症基因组数据集和 PubMed 摘要,作为内部知识语料库,同时结合实时网络搜索。

教程步骤

本教程将演示如何使用 Amazon Quick 整合生物医学数据源进行罕见癌症研究。您将创建一个 Space,启动 Quick Research,并生成一份带引用的报告。

以下视频将逐步演示操作流程:

注意:Amazon Quick 为付费服务。按照本教程操作将产生计费资源。为避免持续收费,请完成本帖末尾的清理步骤。

前提条件

在开始本教程前,您需具备以下条件:

  1. 有效的 AWS 账户。
  2. 具备访问 Amazon Quick 并创建 Spaces 和研究项目的权限。
  3. 对生物医学研究术语有基本了解。

第一部分:创建 Space

  1. 打开 Amazon Quick,在主导航栏中选择 Spaces
  2. 选择 Create space 以添加研究所需文件。
  3. 选择 Add knowledge
  4. 从文件上传、仪表板或知识库中选择。

在页面顶部输入 Space 名称。

确认您的 Space 已出现在 Spaces 列表中,状态显示绿色勾选标记或 Ready。点击 Space 名称,验证所有上传文件均已列出且状态为 Indexed

第二部分:创建研究项目

在 Amazon Quick 主页上,选择 Quick Research。点击 New Research 以启动结构化工作流,引导您从设定目标直至最终报告生成。

第三部分:定义目标

在文本框中输入研究目标。聚焦且具体的问题将获得更佳结果。

示例目标:

_针对具有特定基因组改变的儿童肉瘤,有哪些前景良好的靶向治疗方案?我们如何识别可能从中受益的患者?_

明确你的研究目标并界定调查范围。AI 代理将帮助你优化研究问题,并根据可用的数据源建议你可能希望探索的其他角度。

第 4 部分:数据源选择与整合

选择要纳入研究的数据源:

图 1:Amazon Quick New Research 界面截图,显示研究目标输入框(示例文本关于儿童肉瘤)以及展开的“研究材料”部分,包含网络搜索、文件上传和 Quick 资产选项。
  • 选择 文件上传 以添加特定文档。将 Quick Research 连接到你现有的数据空间,以便在研究中纳入内部文档、报告和知识库。在此处,你可以将外部网络资源与组织专有信息结合使用。
图 2:Amazon Quick Research 中“文件上传”对话框截图,显示支持的文件格式(csv、docx、pdf、xls、xlsx),以及已上传名为 kazansky-dissertation-deposit.pdf 的文件,并提供最多可上传 20 个文件的选项。
  • 选择 Quick 资产 以包含数据空间、仪表板和知识库。这些是按 Quick 组织的文件、文档和分析集合,便于快速访问和分析。
图 3:“添加 Quick 资产”对话框截图,显示“癌症研究知识”搜索字段,以及一个表格,展示“组织罕见癌症研究知识空间”,列包括名称、类型、所有者和最后修改时间。

Quick Research 会自动从连接的存储库中识别相关数据源。针对本次儿童肉瘤调查,系统识别出以下关联:

  • 基因组突变数据与药物靶点数据库
  • 临床结果数据与治疗方案文献
  • 生物标志物谱与患者反应模式
  • 历史试验数据与当前治疗选择

第 5 部分:AI 驱动的研究计划

Quick Research 在运行前会生成结构化计划。请审阅代理将要调查的主题:

  • 主题 1:儿童肉瘤的基因组指导靶向治疗——患者选择与治疗策略。
  • 主题 2:儿童肉瘤的基因组特征——突变、基因融合(如 PAX3)及亚型,包括横纹肌肉瘤、尤文肉瘤和骨肉瘤。
  • 主题 3:当前 FDA 批准的靶向疗法——作用机制、疗效及基因组特征。
  • 主题 4:未来方向——基因编辑、细胞疗法、新型药物递送系统及临床前研究。
图 4:“待探索主题”部分截图,显示 AI 生成的研究计划,主题包括“基因组指导的靶向治疗”、“儿童肉瘤基因组特征”、“当前 FDA 批准的靶向治疗”及其他研究领域。

第 6 部分:修订计划(可选)并开始研究

  1. 选择 修订计划 以在运行前调整范围。
  2. 添加具体关注领域,例如:
  • 增加关于特定突变和基因融合的部分
  • 增加不同方法之间的比较分析

当你对计划满意后,选择 开始研究

确认你看到进度指示器和消息 Research in progress。状态应从 未开始 变为 进行中

第 7 部分:审阅报告

Quick Research 将发现综合成结构化报告,内容包括:

  • 包含关键发现和临床意义的执行摘要。
  • 包含支持性数据可视化的详细分析部分。
  • 基于证据的未来研究方向建议。
  • 引用来源与方法透明度。
  • 临床实施的可行下一步措施。
  • 来源列表。

此过程大约需要 20–30 分钟完成。

图 5:已完成的研究报告截图,标题为“儿童肉瘤的基因组指导靶向治疗”,显示“执行摘要”部分、包含主题的导航侧边栏,以及包含研究改进建议的“评论”面板。

#### 1. 访问已完成的研究

  • 在主导航中选择 研究
  • 查找你的研究项目状态,应显示为 已完成
  • 选择你已完成的研究项目。

#### 2. 浏览研究报告

该报告以结构化格式综合了所有选定来源的信息。

  • 使用左侧窗格中的 Topics 标签在主要章节之间切换。
  • 查阅各章节内的支持性证据和来源引用。
  • 根据需要使用右上角的 DownloadSummarizeShare 按钮。
  • 选择 Reading mode 以隐藏侧边栏,专注于内容。

#### 3. 查看引用

引用提供对原始资料的直接访问,便于验证和深入调查。

  • 在报告中查找编号的引用。
  • 点击引用编号以查看来源详情。
  • 注意弹窗会显示源文章及指向原始页面的超链接。

#### 4. 理解语句分析

语句分析展示研究结论背后的推理过程,并提高分析过程的透明度。

  • 寻找 Understand the statement 图标(三条横线加一个加号)。
  • 点击报告中任意语句旁的该图标。
  • 查看解释窗口,其中包含:
  • 该语句是如何得出的。
  • 证据摘要。

第8部分:更新研究

如需通过新增关注领域优化研究,请直接在报告中添加修订评论。

#### 1. 添加修订评论

Quick Research 会在后续运行中利用您的评论进行修订。

  • 在研究报告中,选中文字 以扩展或修改内容。
  • 在右侧的 Research pane 中添加评论(最多400字符):Need deeper investigation on "specific topic area"

#### 2. 启动修订流程

  • 点击 Revise 按钮(添加评论后可用)。
  • 确认出现 Review revision started 提示。
  • Quick Research 将分析现有内容并应用评论。

研究通常需20–40分钟完成,修订完成后版本号将递增(例如,Version 2)。

#### 3. 查看版本历史

版本控制保留清晰的研究过程审计轨迹,并保存先前迭代版本。

  • 注意版本号已递增。
  • 对比不同版本,查看反馈如何被整合。
  • 通过版本追踪研究的演进过程。

#### 4. 使用摘要功能

不同的摘要格式满足不同受众需求和演示场景。

  • 点击右上角的 Summarize 按钮。
  • 选择摘要类型:
  • Executive Summary:面向高管,最多2页,无引用。
  • General Share Out:面向业务人员,最多6页,含关键引用。
  • Custom Summary:自定义格式,最多5,000字符。

#### 5. 下载与分享

多种下载格式支持不同使用场景,从正式演示到协作审阅。

  • 使用 Download 按钮获取:
  • PDF 格式用于演示。
  • Word 格式用于协作编辑。
  • 使用 Share 按钮与团队成员共享研究报告。

清理

以下步骤将永久删除您的研究报告及上传至 Spaces 的所有文件。如需保留任何研究成果或上传数据,请先导出报告(PDF 或 Word 格式)并下载重要文件。

研究完成后,可通过以下步骤删除研究报告及相关资源:

  1. 删除报告:
  2. 选择报告。
  3. 选择 Actions
  4. 选择 Delete
  1. 删除资源:
  2. 打开 Amazon Quick 控制台中的 Spaces 部分。
  3. 找到要移除的空间,点击其名称旁的 More actions (•••) 菜单。
  4. 选择 Delete 以移除空间。

删除这些资源将停止所有相关费用。

结论

本文展示了 Amazon Quick Research 如何整合公开可用的生物医学数据库与您自己的研究语料库,以支持罕见癌症研究。借助 Quick Research,您的团队可以用自然语言提出跨越多个数据源的复杂问题,通过 AI 驱动的分析识别细微关联,并综合来自多样化数据集的发现,从而支持监管申报、资金申请和临床决策。最终成果是更快的研究进程和更全面、基于证据的洞察,可指导临床决策、引导未来研究投资,并改善面临罕见癌症诊断患者的治疗结果。

如需开始使用您自己的生物医学数据集:

如有疑问或希望分享您的研究成功案例?请留言,或加入 AWS for Industries: Healthcare and Life Sciences 社区

  • * *

关于作者

AI 可能会生成不准确的信息,请核实重要内容