大模型应用开发第四讲:两大方向:增加上下文信息(知识) vs 提升行动力(微调或Agent技术)
资料取自《大模型应用开发:动手做AI Agent 》。
查看总目录:学习大纲
关于DeepSeek本地部署指南可以看下我之前写的文章:DeepSeek R1本地与线上满血版部署:超详细手把手指南
大模型能力提升两大方向详解
以下用 「书房改造」vs「雇佣助理」 的对比,解析两种技术思路的区别与协作
一、方向对比表(先看全局差异)
增加上下文信息(知识增强) | 提升行动力(工具驱动) | |
---|---|---|
目标 | 让AI更「博闻强识」(类似读更多书) | 让AI更「手脚灵活」(类似学习新技能) |
应用场景 | 回答复杂事实类问题(法律、医疗) | 完成跨系统操作任务(订票、写代码) |
技术手段 | 扩展知识库、RAG检索增强 | 微调模型、Agent调用工具链 |
成本 | 低(只需更新数据) | 高(训练模型或搭建工具接口) |
案例 | 律师Agent记住所有法律条文5 | 订票Agent自动查天气/算差价2 |
二、增加上下文信息(打造AI的「移动书库」)
1. 原理拆解:给大模型配U盘
- 原始状态:大模型只知道训练时的知识(截止到2023年数据)[2]
- 增强过程 → 三步走:
1️⃣ 装知识库:导入最新行业资料(如2024年法规)[5]
2️⃣ 建索引贴:给数据打标签(如合同条款→法律术语→生效日期)[5]
3️⃣ 实时调用:回答问题前先「翻书」检索相关段落[6]
2. 生活案例:医疗诊断大升级
场景:患者问:“持续低烧咳嗽,喉咙有红点,可能是什么病?”
- 无增强版 → 仅凭常识判断:普通感冒(可能误诊)
- 知识增强版 → 检索最新医学期刊:发现3月爆发手足口病,特征匹配 → 建议立刻检查手足疹子5
▲ 知识增强流程(参考第5章RAG技术)
三、提升行动力(给AI安装「瑞士军刀」)
1. 两大技术路线
(1) 微调模型:针对性特训
- 适用场景:垂直领域专业知识(如金融术语解读)[2]
案例:
原始模型将「对冲基金」解释为「风险投资」 → 微调后:准确区分对冲策略与风投差异,结合案例说明2
(2) Agent工具链:万能插件箱
- 架构核心 → 四大能力:
▸ 规划:拆解任务(订机票→查价/比价/付款)[5]
▸ 工具:调用接口(12306系统+支付API)[6]
▸ 验证:校验结果(票价+时间无冲突)[1]
▸ 纠错:异常处理(若航班取消→自动改签)[6]
2. 对比案例:订酒店任务
步骤 | 纯大模型 | Agent工具版 |
---|---|---|
理解需求 | ✔️ “杭州周末酒店” | ✔️ + 自动提取关键词(预算/位置)[5] |
查实时价格 | ❌ 只能编造虚假报价 | ✔️ 调用携程API获取真实数据[6] |
多平台比价 | ❌ 无法操作 | ✔️ 同时查询美团/飞猪并对比[6] |
异常处理 | ❌ 报价过时不警告 | ✔️ 发现库存紧张→立刻弹窗提醒[1] |
▲ Agent工具链协作流程(第2章、第6章ReAct框架)
四、双剑合璧:典型案例拆解
案例:法律咨询Agent升级
原始痛点:
- 法律条文更新不及时 → 建议过时
- 只能口头建议 → 无法生成正式文书
改造方案 → 组合拳:
1️⃣ 增加知识:每天自动爬取最高法院新规 → 存入向量数据库[5]
2️⃣ 增强行动:接入文书生成工具(自动编写起诉状/合同模板)[6]
效果对比:
用户请求 | 旧版响应 | 新版响应 |
---|---|---|
“怎么写离婚协议?” | 给出通用模板(可能不符合最新法规) | ①检索本地最新模板 ②插入用户个性化条款 ③导出Word文件5 |
“对方拖欠货款怎么办?” | 口头说明法律流程 | ①生成催款函 ②对接EMS接口自动寄送 ③跟踪物流并提醒[6] |
核心知识点索引
- 知识增强技术:
▸ 长期记忆机制(《大模型应用开发:动手做AI Agent 》第2章2.3节)[5]
▸ 检索增强生成RAG(《大模型应用开发:动手做AI Agent 》第5章)[5] - 行动力提升技术:
▸ Function Calling(《大模型应用开发:动手做AI Agent 》第5章)[6]
▸ ReAct框架与工具调用(《大模型应用开发:动手做AI Agent 》第2章、第6章)1 - 组合应用案例:职场PPT助手Agent(《大模型应用开发:动手做AI Agent 》第4章)[6]
终极口诀:
- 知识库解决「不懂装懂」 → 让AI更专业✅
- Agent工具解决「光说不练」 → 让AI真干活✅
目录:总目录
上篇文章:大模型应用开发第三讲:大模型是Agent的“大脑”,提供通用推理能力(如GPT-4、Claude 3)
下篇文章:大模型应用开发第五讲:成熟度模型:从ChatGPT(L2)到未来自主Agent(L4)
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。