Skip to content

Commit c5cff13

Browse files
committed
Add AI Agent guide with images and detailed explanations
1 parent 0285a21 commit c5cff13

File tree

9 files changed

+159
-0
lines changed

9 files changed

+159
-0
lines changed
76.6 KB
Loading
271 KB
Loading
332 KB
Loading
492 KB
Loading
190 KB
Loading
316 KB
Loading
604 KB
Loading
2.51 MB
Loading
Lines changed: 159 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,159 @@
1+
---
2+
title: "什么是 AI Agent?简要介绍与构建指南"
3+
summary: "本文介绍了 AI Agent 的基本概念及其与传统生成式 AI 的区别,并通过一个保险理赔场景,分步骤讲解如何构建一个可自主完成复杂任务的 AI Agent。"
4+
authors: ["Maximilian Vogel"]
5+
translators: ["云原生社区"]
6+
categories: ["AI"]
7+
tags: ["AI Agents", "生成式AI", "RAG", "LangChain", "自动化流程"]
8+
draft: false
9+
date: 2025-04-18T09:30:08+08:00
10+
links:
11+
- icon: language
12+
icon_pack: fa
13+
name: 阅读英文版原文
14+
url: https://maximilianvogel.medium.com/what-are-ai-agents-a-short-intro-and-a-step-by-step-guide-to-build-your-own-1cbb17d08ba0
15+
---
16+
17+
**下一件大事?** Gartner 认为 AI Agent 将引领未来。OpenAI、Nvidia 和 Microsoft 都在下注,就连在 AI 领域一直比较低调的 Salesforce 也开始布局。
18+
19+
这一趋势确实正在快速起飞。
20+
21+
![](f1.png)
22+
23+
“AI Agents” 在 Google Trends 上的搜索趋势(来源:trends.google.com)
24+
25+
## 什么是 AI Agent?关键词是 “Agency”
26+
27+
不同于传统的生成式 AI 系统,Agent 不只是回应用户输入,而是能够**自主处理一个复杂流程**,比如处理一个保险理赔请求:理解邮件内容、图像、PDF 文件,从客户数据库提取信息,比对条款、与客户沟通并等待对方回复(哪怕是几天后)——整个过程中不丢失上下文。
28+
29+
**它能自主完成这些操作**,无需人类实时干预。
30+
31+
## 咖啡机与咖啡师的比喻
32+
33+
相比 Copilot 这类工具“辅助”员工,**AI Agent 更像是一位可以独立上岗的“数字员工”**,可实现高程度的流程自动化。
34+
35+
**想象一下**,一个 AI 能够承担当前由人类员工或整个部门完成的复杂任务:
36+
37+
- 策划、设计、执行、评估并优化一场 **营销活动**
38+
- 与物流公司、客户和仓库沟通以**追踪遗失的货物**,若找不到可发起索赔
39+
- 每天**监控商标注册数据库**,发现潜在冲突后自动提起异议
40+
- **汇总 ESG 报告所需数据**,主动向员工发起询问并校验信息准确性
41+
42+
目前的 AI 模型只能在流程中“协助”,而不能主导。**AI Agent 则能完成整个流程的执行**
43+
44+
![](f2.png)
45+
46+
如上图所示,传统生成式 AI 协助团队完成流程(黄色),AI Agent 能从头到尾执行整个任务(橙色)。图片来源:Maximilian Vogel
47+
48+
**如果把传统模型比作高端咖啡机,Agent 则是咖啡师**。咖啡师不仅能做咖啡,还能招呼客人、点单、收银、洗杯子,甚至打烊关店。而咖啡机永远无法独自运营一家咖啡馆。
49+
50+
## 为什么 Agent 能胜任这些任务?
51+
52+
Agent 擅长在复杂流程中**掌控多个子流程**,能自主判断下一步应该执行什么任务。如果遇到问题,它知道该向谁请求帮助(缺咖啡豆就找老板,机器故障就联系售后)。
53+
54+
![](f3.png)
55+
56+
AI Agent 与传统生成式 AI 的比较。图片来源:Maximilian Vogel
57+
58+
## 一位 AI 员工的构成解剖
59+
60+
现在开始动手构建一个 AI Agent,基于上述保险理赔流程,我们来看每一步的设计。
61+
62+
我们的目标是构建业务架构与流程设计。由于篇幅原因,本篇不涉及具体代码实现。
63+
64+
### 第一步:分类并进入处理通道
65+
66+
流程从客户发送邮件报案开始。Agent 需要先**分析邮件内容,识别客户的意图**
67+
68+
一旦分类完成,Agent 会将请求路由至正确的处理通道。通常这远不止是 function calling,而是涉及流程路径的选择与多个步骤的执行。
69+
70+
![](f4.png)
71+
72+
AI Agent 的第一步:对邮件进行分类并分发至对应处理路径。图片来源:Maximilian Vogel
73+
74+
### 第二步:提取数据
75+
76+
下一步,Agent 将**非结构化数据转化为结构化数据**,以实现安全、系统、规范的处理。
77+
78+
- 分类是将文本归入某个类别
79+
- 而抽取是“读懂”数据并提取其中的关键信息
80+
81+
模型并不会直接“复制粘贴”,而是生成带格式的结果,例如将“(718) 123–45678”转换为“+1 718 123 45678”。
82+
83+
![](f5.png)
84+
85+
数据提取可以来自邮件文本、附件图片、PDF等。通常是多模型协作,包含 LLM、OCR 等模块。
86+
87+
示例输入(非结构化):
88+
89+
```
90+
Hi,
91+
92+
I would like to report a damage and ask you to compensate me...
93+
```
94+
95+
输出(结构化 JSON):
96+
97+
```json
98+
{
99+
"name": "Deepak",
100+
"surname": "Jamal",
101+
"address": "123 Main Street, 10008 New York City, NY",
102+
"phone":"+1 718 123 45678",
103+
"contract_no": "HC12-223873923",
104+
"claim_description": "..."
105+
}
106+
```
107+
108+
### 第三步:调用外部系统并持久化上下文
109+
110+
普通生成式 AI 通常只能在会话中处理信息,Agent 则**需要访问并更新数据库与企业系统中的数据**
111+
112+
例如:
113+
114+
- 查询合同号是否存在
115+
- 将处理状态写入客服工单系统
116+
- 向客户或外部方索要补充信息
117+
118+
![](f6.png)
119+
120+
图示:调用系统服务并实现上下文持久化。图片来源:Maximilian Vogel
121+
122+
### 第四步:判断、RAG、推理与置信度
123+
124+
行政流程的核心是**基于规则做判断**。这就需要引入 RAG(检索增强生成),通过向量数据库找出条款内容。
125+
126+
在判断前,我们引导模型“思考过程”,即 prompt 要求其先解释自己的推理过程。
127+
128+
好处包括:
129+
130+
- 给客户一个合理解释
131+
- 帮助数据科学家分析模型是否“瞎猜”
132+
- 判断模型的结果是否有理可循
133+
134+
设置“置信度阈值”也很关键:
135+
136+
- 若置信度低,交给人工处理
137+
- 若置信度高,可全自动处理
138+
139+
阈值的设置影响系统的安全性与自动化程度之间的平衡。
140+
141+
![](f7.png)
142+
143+
AI Agent 的判断流程。图片来源:Maximilian Vogel
144+
145+
至此,如果你实现了以上 2~3 个步骤,你就构建了一个初级 Agent。
146+
147+
你可以使用 crewAI、langGraph、langFlow 等框架,也可以直接用 Python 编写。
148+
149+
根据实践,这种 Agent 可承担理赔部门 70%~90% 的工作量。这是传统生成式 AI 无法完成的。
150+
151+
![](f8.png)
152+
153+
AI Agent 的三大法则(致敬 Asimov 的机器人三定律)。图片来源:Maximilian Vogel
154+
155+
---
156+
157+
我的团队刚刚上线了一个大型物流系统,预计未来几个月我们将继续深耕 Agent 系统的开发。
158+
159+
祝你成功打造属于自己的 AI Agent!

0 commit comments

Comments
 (0)