<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>QLoRA on Lucas Ma 的博客</title>
    <link>https://blog.lucasma.cc/tags/qlora/</link>
    <description>Recent content in QLoRA on Lucas Ma 的博客</description>
    <generator>Hugo</generator>
    <language>zh-cn</language>
    <copyright>2026 Lucas Ma</copyright>
    <lastBuildDate>Fri, 15 May 2026 22:02:11 +0800</lastBuildDate>
    <atom:link href="https://blog.lucasma.cc/tags/qlora/index.xml" rel="self" type="application/rss+xml" />
    <item>
      <title>OncoAgent 深度拆解：医疗 AI Agent 如何用 Corrective RAG、LangGraph 和 QLoRA 防幻觉</title>
      <link>https://blog.lucasma.cc/posts/oncoagent-corrective-rag-langgraph/</link>
      <pubDate>Fri, 15 May 2026 22:02:11 +0800</pubDate>
      <guid>https://blog.lucasma.cc/posts/oncoagent-corrective-rag-langgraph/</guid>
      <description>&lt;h2 id=&#34;前言&#34;&gt;前言&lt;/h2&gt;
&lt;p&gt;AI Agent 做 Demo 很容易，做生产系统很难；做普通生产系统已经难，做医疗场景更是地狱级难度。&lt;/p&gt;
&lt;p&gt;因为医疗 AI 不能只追求「回答像不像专家」，它必须解决更硬的问题：&lt;strong&gt;答案有没有指南依据？患者隐私能不能留在本地？复杂病例该不该升级给更强模型？模型胡说八道之前有没有安全闸门？&lt;/strong&gt;&lt;/p&gt;
&lt;p&gt;Hugging Face 最近有一篇关于 &lt;strong&gt;OncoAgent&lt;/strong&gt; 的技术预印本，给了一个很完整的参考架构：LangGraph 多节点编排、Corrective RAG、双层模型路由、QLoRA 微调、Reflexion 安全校验、Human-in-the-Loop 人类审查，全都放进同一个系统里。&lt;/p&gt;
&lt;p&gt;今天我们不做资讯复述，直接拆它的工程设计，看看一个面向肿瘤临床决策支持的 Agent 系统，到底该怎么搭。&lt;/p&gt;
&lt;h2 id=&#34;目录&#34;&gt;目录&lt;/h2&gt;
&lt;ul&gt;
&lt;li&gt;&lt;a href=&#34;#%E4%B8%BA%E4%BB%80%E4%B9%88%E5%8C%BB%E7%96%97-agent-%E4%B8%8D%E8%83%BD%E5%8F%AA%E9%9D%A0%E4%B8%80%E4%B8%AA%E5%A4%A7%E6%A8%A1%E5%9E%8B&#34;&gt;为什么医疗 Agent 不能只靠一个大模型&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#oncoagent-%E7%9A%84%E6%95%B4%E4%BD%93%E6%9E%B6%E6%9E%84&#34;&gt;OncoAgent 的整体架构&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#%E5%A4%8D%E6%9D%82%E5%BA%A6%E8%B7%AF%E7%94%B1%E7%AE%80%E5%8D%95%E7%97%85%E4%BE%8B%E5%BF%AB%E7%AD%94%E5%A4%8D%E6%9D%82%E7%97%85%E4%BE%8B%E6%B7%B1%E6%8E%A8%E7%90%86&#34;&gt;复杂度路由：简单病例快答，复杂病例深推理&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#corrective-rag%E5%85%88%E8%AF%81%E6%98%8E%E8%B5%84%E6%96%99%E9%9D%A0%E8%B0%B1%E5%86%8D%E8%AE%A9%E6%A8%A1%E5%9E%8B%E5%9B%9E%E7%AD%94&#34;&gt;Corrective RAG：先证明资料靠谱，再让模型回答&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#reflexion-%E5%AE%89%E5%85%A8%E5%BE%AA%E7%8E%AF%E6%8A%8A%E5%B9%BB%E8%A7%89%E6%8C%A1%E5%9C%A8%E5%87%BA%E5%8F%A3%E5%89%8D&#34;&gt;Reflexion 安全循环：把幻觉挡在出口前&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#qlora-%E5%BE%AE%E8%B0%83%E4%B8%BA%E4%BB%80%E4%B9%88%E4%B8%80%E5%BC%A0-mi300x-%E5%B0%B1%E8%83%BD%E8%AE%AD%E5%AE%8C%E6%95%B4%E5%A5%97%E6%A8%A1%E5%9E%8B&#34;&gt;QLoRA 微调：为什么一张 MI300X 就能训完整套模型&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#%E9%9A%90%E7%A7%81%E4%B8%8E%E8%AE%B0%E5%BF%86%E9%9A%94%E7%A6%BB%E5%8C%BB%E7%96%97%E5%9C%BA%E6%99%AF%E7%9A%84%E5%BA%95%E7%BA%BF%E5%B7%A5%E7%A8%8B&#34;&gt;隐私与记忆隔离：医疗场景的底线工程&lt;/a&gt;&lt;/li&gt;
&lt;li&gt;&lt;a href=&#34;#%E5%AE%9E%E6%88%98%E5%BB%BA%E8%AE%AE%E6%99%AE%E9%80%9A%E5%9B%A2%E9%98%9F%E8%83%BD%E6%8A%84%E5%93%AA%E4%BA%9B%E4%BD%9C%E4%B8%9A&#34;&gt;实战建议：普通团队能抄哪些作业&lt;/a&gt;&lt;/li&gt;
&lt;/ul&gt;
&lt;hr&gt;
&lt;h2 id=&#34;为什么医疗-agent-不能只靠一个大模型&#34;&gt;为什么医疗 Agent 不能只靠一个大模型&lt;/h2&gt;
&lt;p&gt;很多人做 Agent 的第一反应是：找一个最强模型，塞一段系统提示词，再接上知识库。&lt;/p&gt;
&lt;p&gt;在医疗场景里，这个方案风险太大。&lt;/p&gt;
&lt;p&gt;原因很简单：&lt;strong&gt;医疗问答不是开放式闲聊，而是带责任边界的证据推理&lt;/strong&gt;。模型输出的每句话，都应该能追溯到指南、病历、检索材料或明确的安全拒答策略。&lt;/p&gt;
&lt;p&gt;OncoAgent 针对的是肿瘤临床决策支持。它要面对的问题包括：&lt;/p&gt;
&lt;ol&gt;
&lt;li&gt;指南资料多且更新快，比如 NCCN、ESMO 等专业指南。&lt;/li&gt;
&lt;li&gt;医学术语高度精确，「TKI」和「tyrosine kinase inhibitor」这种同义表达必须能匹配。&lt;/li&gt;
&lt;li&gt;患者数据涉及 PHI（Protected Health Information，受保护健康信息），不能随便丢给云端 API。&lt;/li&gt;
&lt;li&gt;复杂病例不能让模型自由发挥，必须有医生审核。&lt;/li&gt;
&lt;li&gt;检索不到可靠依据时，宁愿拒答，也不能编一个看似合理的方案。&lt;/li&gt;
&lt;/ol&gt;
&lt;p&gt;所以 OncoAgent 的核心思路不是「让 LLM 更会说」，而是把系统拆成多个可控环节：&lt;strong&gt;路由、检索、生成、校验、审查、兜底&lt;/strong&gt;。&lt;/p&gt;
&lt;p&gt;这才是医疗 Agent 和普通聊天机器人的分水岭。&lt;/p&gt;</description>
    </item>
  </channel>
</rss>
