|
| 1 | +--- |
| 2 | +title: "什么是 AI Agent?简要介绍与构建指南" |
| 3 | +summary: "本文介绍了 AI Agent 的基本概念及其与传统生成式 AI 的区别,并通过一个保险理赔场景,分步骤讲解如何构建一个可自主完成复杂任务的 AI Agent。" |
| 4 | +authors: ["Maximilian Vogel"] |
| 5 | +translators: ["云原生社区"] |
| 6 | +categories: ["AI"] |
| 7 | +tags: ["AI Agents", "生成式AI", "RAG", "LangChain", "自动化流程"] |
| 8 | +draft: false |
| 9 | +date: 2025-04-18T09:30:08+08:00 |
| 10 | +links: |
| 11 | + - icon: language |
| 12 | + icon_pack: fa |
| 13 | + name: 阅读英文版原文 |
| 14 | + url: https://maximilianvogel.medium.com/what-are-ai-agents-a-short-intro-and-a-step-by-step-guide-to-build-your-own-1cbb17d08ba0 |
| 15 | +--- |
| 16 | + |
| 17 | +**下一件大事?** Gartner 认为 AI Agent 将引领未来。OpenAI、Nvidia 和 Microsoft 都在下注,就连在 AI 领域一直比较低调的 Salesforce 也开始布局。 |
| 18 | + |
| 19 | +这一趋势确实正在快速起飞。 |
| 20 | + |
| 21 | + |
| 22 | + |
| 23 | +“AI Agents” 在 Google Trends 上的搜索趋势(来源:trends.google.com) |
| 24 | + |
| 25 | +## 什么是 AI Agent?关键词是 “Agency” |
| 26 | + |
| 27 | +不同于传统的生成式 AI 系统,Agent 不只是回应用户输入,而是能够**自主处理一个复杂流程**,比如处理一个保险理赔请求:理解邮件内容、图像、PDF 文件,从客户数据库提取信息,比对条款、与客户沟通并等待对方回复(哪怕是几天后)——整个过程中不丢失上下文。 |
| 28 | + |
| 29 | +**它能自主完成这些操作**,无需人类实时干预。 |
| 30 | + |
| 31 | +## 咖啡机与咖啡师的比喻 |
| 32 | + |
| 33 | +相比 Copilot 这类工具“辅助”员工,**AI Agent 更像是一位可以独立上岗的“数字员工”**,可实现高程度的流程自动化。 |
| 34 | + |
| 35 | +**想象一下**,一个 AI 能够承担当前由人类员工或整个部门完成的复杂任务: |
| 36 | + |
| 37 | +- 策划、设计、执行、评估并优化一场 **营销活动** |
| 38 | +- 与物流公司、客户和仓库沟通以**追踪遗失的货物**,若找不到可发起索赔 |
| 39 | +- 每天**监控商标注册数据库**,发现潜在冲突后自动提起异议 |
| 40 | +- **汇总 ESG 报告所需数据**,主动向员工发起询问并校验信息准确性 |
| 41 | + |
| 42 | +目前的 AI 模型只能在流程中“协助”,而不能主导。**AI Agent 则能完成整个流程的执行**。 |
| 43 | + |
| 44 | + |
| 45 | + |
| 46 | +如上图所示,传统生成式 AI 协助团队完成流程(黄色),AI Agent 能从头到尾执行整个任务(橙色)。图片来源:Maximilian Vogel |
| 47 | + |
| 48 | +**如果把传统模型比作高端咖啡机,Agent 则是咖啡师**。咖啡师不仅能做咖啡,还能招呼客人、点单、收银、洗杯子,甚至打烊关店。而咖啡机永远无法独自运营一家咖啡馆。 |
| 49 | + |
| 50 | +## 为什么 Agent 能胜任这些任务? |
| 51 | + |
| 52 | +Agent 擅长在复杂流程中**掌控多个子流程**,能自主判断下一步应该执行什么任务。如果遇到问题,它知道该向谁请求帮助(缺咖啡豆就找老板,机器故障就联系售后)。 |
| 53 | + |
| 54 | + |
| 55 | + |
| 56 | +AI Agent 与传统生成式 AI 的比较。图片来源:Maximilian Vogel |
| 57 | + |
| 58 | +## 一位 AI 员工的构成解剖 |
| 59 | + |
| 60 | +现在开始动手构建一个 AI Agent,基于上述保险理赔流程,我们来看每一步的设计。 |
| 61 | + |
| 62 | +我们的目标是构建业务架构与流程设计。由于篇幅原因,本篇不涉及具体代码实现。 |
| 63 | + |
| 64 | +### 第一步:分类并进入处理通道 |
| 65 | + |
| 66 | +流程从客户发送邮件报案开始。Agent 需要先**分析邮件内容,识别客户的意图**。 |
| 67 | + |
| 68 | +一旦分类完成,Agent 会将请求路由至正确的处理通道。通常这远不止是 function calling,而是涉及流程路径的选择与多个步骤的执行。 |
| 69 | + |
| 70 | + |
| 71 | + |
| 72 | +AI Agent 的第一步:对邮件进行分类并分发至对应处理路径。图片来源:Maximilian Vogel |
| 73 | + |
| 74 | +### 第二步:提取数据 |
| 75 | + |
| 76 | +下一步,Agent 将**非结构化数据转化为结构化数据**,以实现安全、系统、规范的处理。 |
| 77 | + |
| 78 | +- 分类是将文本归入某个类别 |
| 79 | +- 而抽取是“读懂”数据并提取其中的关键信息 |
| 80 | + |
| 81 | +模型并不会直接“复制粘贴”,而是生成带格式的结果,例如将“(718) 123–45678”转换为“+1 718 123 45678”。 |
| 82 | + |
| 83 | + |
| 84 | + |
| 85 | +数据提取可以来自邮件文本、附件图片、PDF等。通常是多模型协作,包含 LLM、OCR 等模块。 |
| 86 | + |
| 87 | +示例输入(非结构化): |
| 88 | + |
| 89 | +``` |
| 90 | +Hi, |
| 91 | +
|
| 92 | +I would like to report a damage and ask you to compensate me... |
| 93 | +``` |
| 94 | + |
| 95 | +输出(结构化 JSON): |
| 96 | + |
| 97 | +```json |
| 98 | +{ |
| 99 | + "name": "Deepak", |
| 100 | + "surname": "Jamal", |
| 101 | + "address": "123 Main Street, 10008 New York City, NY", |
| 102 | + "phone":"+1 718 123 45678", |
| 103 | + "contract_no": "HC12-223873923", |
| 104 | + "claim_description": "..." |
| 105 | +} |
| 106 | +``` |
| 107 | + |
| 108 | +### 第三步:调用外部系统并持久化上下文 |
| 109 | + |
| 110 | +普通生成式 AI 通常只能在会话中处理信息,Agent 则**需要访问并更新数据库与企业系统中的数据**。 |
| 111 | + |
| 112 | +例如: |
| 113 | + |
| 114 | +- 查询合同号是否存在 |
| 115 | +- 将处理状态写入客服工单系统 |
| 116 | +- 向客户或外部方索要补充信息 |
| 117 | + |
| 118 | + |
| 119 | + |
| 120 | +图示:调用系统服务并实现上下文持久化。图片来源:Maximilian Vogel |
| 121 | + |
| 122 | +### 第四步:判断、RAG、推理与置信度 |
| 123 | + |
| 124 | +行政流程的核心是**基于规则做判断**。这就需要引入 RAG(检索增强生成),通过向量数据库找出条款内容。 |
| 125 | + |
| 126 | +在判断前,我们引导模型“思考过程”,即 prompt 要求其先解释自己的推理过程。 |
| 127 | + |
| 128 | +好处包括: |
| 129 | + |
| 130 | +- 给客户一个合理解释 |
| 131 | +- 帮助数据科学家分析模型是否“瞎猜” |
| 132 | +- 判断模型的结果是否有理可循 |
| 133 | + |
| 134 | +设置“置信度阈值”也很关键: |
| 135 | + |
| 136 | +- 若置信度低,交给人工处理 |
| 137 | +- 若置信度高,可全自动处理 |
| 138 | + |
| 139 | +阈值的设置影响系统的安全性与自动化程度之间的平衡。 |
| 140 | + |
| 141 | + |
| 142 | + |
| 143 | +AI Agent 的判断流程。图片来源:Maximilian Vogel |
| 144 | + |
| 145 | +至此,如果你实现了以上 2~3 个步骤,你就构建了一个初级 Agent。 |
| 146 | + |
| 147 | +你可以使用 crewAI、langGraph、langFlow 等框架,也可以直接用 Python 编写。 |
| 148 | + |
| 149 | +根据实践,这种 Agent 可承担理赔部门 70%~90% 的工作量。这是传统生成式 AI 无法完成的。 |
| 150 | + |
| 151 | + |
| 152 | + |
| 153 | +AI Agent 的三大法则(致敬 Asimov 的机器人三定律)。图片来源:Maximilian Vogel |
| 154 | + |
| 155 | +--- |
| 156 | + |
| 157 | +我的团队刚刚上线了一个大型物流系统,预计未来几个月我们将继续深耕 Agent 系统的开发。 |
| 158 | + |
| 159 | +祝你成功打造属于自己的 AI Agent! |
0 commit comments