Please enable Javascript to view the contents

从零开始构建你的第一个ai-agent

 ·  ☕ 7 分钟  ·  🪶 VictorHong · 👀... 阅读

Reference:

从零开始构建你的第一个AI Agent:一个周末的完整实战指南

封面图

引言:为什么AI Agent正在改变一切

2025年,AI领域最热门的话题不再是"大模型能回答什么问题",而是"AI Agent能帮你完成什么任务"。从ChatGPT的代码解释器到Claude的Artifacts,从AutoGPT到CrewAI,Agent框架如雨后春笋般涌现。但当你真正想动手构建一个时,却发现到处是术语轰炸:多智能体编排、Agentic循环、工具调用、子Agent协调…

听起来像是需要计算机学位和三年后端经验才能入门?

完全不是。

本文将带你用一个周末的时间,从零开始构建一个真正可用的AI Agent。不是聊天机器人,不是简单的自动化脚本,而是一个能够接收目标、自主规划、调用工具、持续迭代直到完成任务的智能体。

到周日晚上,你将拥有一个真正"运行起来像魔法"的系统。

本文假设你几乎没有编程经验。如果你能按照说明操作、在终端输入命令,你就能完成这个构建。

让我们开始吧。


第三章:周六下午——构建Agent大脑(3小时)

Agent循环的工作原理

每个Agent都遵循相同的基本循环:

  1. 向Claude发送目标,附带可用工具的描述
  2. Claude决定是否需要使用工具来完成目标
  3. 如果需要,Claude告诉你要调用哪个工具以及输入什么参数
  4. 你的代码执行工具并将结果返回给Claude
  5. Claude决定是否需要另一个工具,或者目标是否已完成
  6. 重复直到完成

Agent Loop

这就是全部概念。其他都是细节。

第四步:构建简单Agent

创建名为 agent.py 的文件,用任意文本编辑器打开。

这里不粘贴完整代码,而是告诉你需要构建什么如何构建

向Claude发送以下提示:

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
我想用Anthropic API在Python中构建我的第一个AI Agent。

Agent应该:
1. 接收用户的目标
2. 拥有2个工具:网页搜索工具(用返回模拟数据的函数模拟)和计算器工具
3. 使用标准Agent循环:发送消息→检查Claude是否想使用工具→执行工具→返回结果→重复直到完成
4. 打印每个步骤以便观察Agent的思考过程

要求:
- 使用Anthropic Python SDK
- 使用claude-sonnet-4-20250514作为模型
- Agent应使用stop_reason正确循环以检测Claude何时完成
- 包含清晰的注释解释每个部分
- 保持简单——这是我第一个Agent

编写我可以保存为agent.py并运行的完整代码。

Claude会生成一个可用的Agent脚本。保存为 agent.py

运行前,将API密钥设置为环境变量:

1
export ANTHROPIC_API_KEY=your-key-here

然后运行:

1
python agent.py

给它一个简单的目标,比如:“847的15%是多少,这是正常的小费金额吗?”

观察终端。你会看到Agent思考问题,决定使用计算器,获取结果,推理这是否是正常小费,并给出最终答案。

这就是你的第一个Agent。一个能够推理、使用工具、迭代实现目标的系统。


第四章:周六晚上——添加真实工具(2小时)

第五步:添加真实网页搜索工具

模拟工具只是概念验证。现在让我们添加真实的东西。

请Claude修改你的Agent,使用Tavily的搜索API(有慷慨的免费额度)代替模拟搜索功能。或者使用任何返回真实数据的免费API——天气、新闻、股票价格。

关键是将模拟工具替换为访问真实、实时数据的东西。当你再次运行Agent并询问需要当前信息的问题时,它会实际搜索网页、处理结果,并将其整合到推理中。

这是它从玩具变成真正有用东西的时刻。

第六步:添加文件读取工具

添加一个让Agent读取你电脑特定文件夹中文件的工具。请Claude编写一个函数,接收文件名作为输入并返回文件内容。

现在你的Agent可以回答关于本地文档的问题。让它"读取我昨天的笔记并总结要点",它会打开文件、阅读并生成摘要。

两个工具——搜索和文件读取——已经让Agent对真实任务有用。你可以研究一个主题并让Agent将发现写入文件。你可以指向一个文档让它分析内容。


第五章:周日上午——让它能对话(2小时)

第七步:添加对话记忆

现在你的Agent一次处理一个目标。让我们让它处理完整的对话,记住一切。

请Claude修改Agent以维护对话历史。每次交互后,完整的消息历史被保留并随下一个请求发送。这意味着Agent记住你们讨论的内容,可以基于之前的答案继续。

这是一次性工具和助手之间的区别。助手记住你在研究特定主题,可以继续线程而无需你重新解释一切。

第八步:添加错误处理

真实工具有时会失败。API超时。文件不存在。数据格式错误。

请Claude为每个工具添加适当的错误处理:结构化的错误消息告诉Agent发生了什么以及下一步该做什么。这防止Agent在意外情况发生时崩溃或产生幻觉。

良好的错误处理是演示和你实际每天使用的东西之间的区别。


第六章:周日下午——打磨和测试(2小时)

第九步:用真实任务测试

给你的Agent十个不同的任务。简单的和复杂的。

  • “这周的天气预报是什么?”
  • “阅读我的会议笔记并提取行动项。”
  • “研究关于[主题]的最新新闻并写一段摘要。”
  • “计算10,000美元以5%利率10年的复利。”
  • “找三家阿姆斯特丹评价好的餐厅并进行比较。”

观察它如何处理每个任务。注意哪里表现好,哪里吃力。对于每个吃力的地方,思考什么能解决它——更好的工具描述、更好的错误处理,或额外的工具。

第十步:添加你自己的自定义工具

这是毕业练习。想一个你在生活或工作中反复做的任务。涉及查找信息、处理数据或生成输出的东西。

为它构建一个工具。请Claude帮你编写函数。将它连接到你的Agent。

现在你有了一个带有针对你特定需求定制工具的个性化AI Agent。一个本周末之前不存在的东西。你构建的东西。


第七章:你构建了什么(以及为什么重要)

让我总结一下你现在拥有什么:

一个Python脚本,接收自然语言目标,推理如何实现,使用多个工具收集信息和执行计算,优雅地处理错误,维护对话历史,并可以用你需要的任何新工具扩展。

这是一个真正的AI Agent。 不是聊天API的包装器。一个实际自主推理和行动的系统。

而你用一个周末构建了它。


第八章:接下来去哪里

第2周:根据你实际需要的添加三到五个工具。天气、日历、邮件、文件创建、数据分析——任何符合你工作流程的东西。

第3周:将你的Agent部署到可以持续运行的地方。树莓派、便宜的云服务器,或者只是你的笔记本电脑。连接到Telegram或WhatsApp,这样你可以从手机与它对话。

第2个月:研究多智能体架构。构建一个多个专业Agent协同工作的系统——一个用于研究,一个用于写作,一个用于数据分析——由一个中央Agent协调。

第3个月:开始为其他人构建Agent。你这周末学到的每一项技能都是企业愿意付费的技能。能够构建自定义AI Agent的人才市场正在快速增长,供应远未满足需求。


结语:诚实的真相

你的第一个Agent会很粗糙。它会犯错。偶尔会使用错误的工具或给出奇怪的答案。

这完全没关系。

每个构建过东西的开发者都是从粗糙的东西开始的。重点不是完美。重点是通过实际构建来理解Agent如何工作。这种理解比任何阅读或观看教程都更有价值。

你现在有了AI Agent如何运作的心智模型。你理解循环、工具调用、推理链。从现在开始你学到的关于Agent的一切都会更有意义,因为你亲手感受过它的工作原理。

一个周末。一个可用的Agent。一种大多数人认为需要数月学习才能掌握的新能力。

这就是构建而不是只学习的威力。


附录:关键概念速查

术语 简单解释
Agent循环 Agent接收目标→决定行动→执行→检查完成→重复的循环
工具调用 Agent请求使用外部功能(搜索、计算、文件操作)
对话记忆 Agent记住之前的交互,保持上下文连贯
API密钥 访问AI服务的凭证,需要保密
环境变量 存储配置(如API密钥)的系统设置

本文灵感来自Khairallah AL-Awady的X Article,经扩展和本地化以适合中文读者。


VictorHong
作者
VictorHong
🔩工具控,⌨️ 后端程序员,🧪AI 探索者