OncoAgent 深度拆解：医疗 AI Agent 如何用 Corrective RAG、LangGraph 和 QLoRA 防幻觉

Fri, 15 May 2026 22:02:11 +0800

前言

AI Agent 做 Demo 很容易，做生产系统很难；做普通生产系统已经难，做医疗场景更是地狱级难度。

因为医疗 AI 不能只追求「回答像不像专家」，它必须解决更硬的问题：答案有没有指南依据？患者隐私能不能留在本地？复杂病例该不该升级给更强模型？模型胡说八道之前有没有安全闸门？

Hugging Face 最近有一篇关于 OncoAgent 的技术预印本，给了一个很完整的参考架构：LangGraph 多节点编排、Corrective RAG、双层模型路由、QLoRA 微调、Reflexion 安全校验、Human-in-the-Loop 人类审查，全都放进同一个系统里。

今天我们不做资讯复述，直接拆它的工程设计，看看一个面向肿瘤临床决策支持的 Agent 系统，到底该怎么搭。

为什么医疗 Agent 不能只靠一个大模型

很多人做 Agent 的第一反应是：找一个最强模型，塞一段系统提示词，再接上知识库。

在医疗场景里，这个方案风险太大。

原因很简单：医疗问答不是开放式闲聊，而是带责任边界的证据推理。模型输出的每句话，都应该能追溯到指南、病历、检索材料或明确的安全拒答策略。

OncoAgent 针对的是肿瘤临床决策支持。它要面对的问题包括：

指南资料多且更新快，比如 NCCN、ESMO 等专业指南。
医学术语高度精确，「TKI」和「tyrosine kinase inhibitor」这种同义表达必须能匹配。
患者数据涉及 PHI（Protected Health Information，受保护健康信息），不能随便丢给云端 API。
复杂病例不能让模型自由发挥，必须有医生审核。
检索不到可靠依据时，宁愿拒答，也不能编一个看似合理的方案。

所以 OncoAgent 的核心思路不是「让 LLM 更会说」，而是把系统拆成多个可控环节：路由、检索、生成、校验、审查、兜底。

这才是医疗 Agent 和普通聊天机器人的分水岭。

QLoRA on Lucas Ma 的博客

OncoAgent 深度拆解：医疗 AI Agent 如何用 Corrective RAG、LangGraph 和 QLoRA 防幻觉

前言

目录

为什么医疗 Agent 不能只靠一个大模型