Agents SDK & Responses API
OpenAI 推出了他们的 Agents SDK 和 Responses API——这对像我这样的开发者来说是一个改变游戏规则的工具,它让我们可以构建真正 执行任务 的 AI,而不仅仅是被动地响应。

几个月前,我正埋头在一个复杂的自动化项目中,试图让 AI 代理更加独立。问题是它们需要太多的手动干预。每一步都需要人工提示,这使得自动化感觉……不够自动化。
然后 OpenAI 推出了他们的 Agents SDK 和 Responses API——这对像我这样的开发者来说是一个改变游戏规则的工具,它让我们可以构建真正 执行任务 的 AI,而不仅仅是被动地响应。这些工具让你能够构建 自主使用工具的 AI 代理,它们可以搜索网络、检索文件,甚至调用外部 API 而不需要持续的人类输入。
所以,如果你一直梦想着构建能够独立思考和行动的 AI 系统,那么这个指南就是为你准备的。让我们逐步分解这一切。
1、什么是 OpenAI Agents SDK?
将 Agents SDK 视为构建能够使用工具并做出决策的 AI 的工具包。它允许你的 AI 代理:
✅ 执行多步骤任务(无需你手把手指导)。
✅ 集成外部工具(网络搜索、API 调用、数据库)。
✅ 自主决定使用哪个工具以及何时使用(基于上下文)。
示例: 想象一下你是一名会计师,正在使用一个 AI 税务助手。它不仅回答问题,还可以:
- 从政府数据库拉取最新的税法更新。
- 通过调用记账 API 分析财务报表。
- 根据最新数据生成报告。
在 Agents SDK 出现之前,实现这一点需要一堆手动 API 调用和复杂的逻辑。现在?它已经内置了。
2、使用OpenAI Agents SDK
2.1 安装 SDK
首先,克隆仓库并安装依赖项:
git clone https://github.com/openai/agent-sdk.git
cd agent-sdk
pip install -r requirements.txt
进入全屏模式
退出全屏模式
2.2 设置你的代理
定义你的 AI 可以使用的工具。假设我们想启用 网络搜索 和 文件检索:
from agent_sdk import Agent, WebSearchTool, FileRetrievalTool
search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()
agent = Agent(tools=[search_tool, file_tool])
现在你的代理知道如何搜索网络和获取文档。
2.3 让它自行决策
与传统的聊天机器人不同,这个 AI 根据用户输入决定使用哪个工具:
def agent_task(query):
result = agent.use_tool("web_search", query)
return result
response = agent_task("最新的 AI 研究论文")
print(response)
无需手动干预——只需 自主执行。
3、什么是 OpenAI Responses API?
Responses API 关注的是如何改进 AI 与用户的交互方式。
它让你的 AI:
✅ 动态调用函数(例如,获取天气更新、预订约会)。
✅ 返回结构化响应 而不是随机文本。
✅ 实时流式传输响应,提供更流畅的用户体验。
可以将其视为给你的 AI 一个更好的界面来与世界互动。
4、使用 Responses API 构建更智能的 AI
4.1 设置 API 身份验证
你需要你的 OpenAI API 密钥:
import openai
openai.api_key = "your_api_key"
4.2 定义 AI 可以调用的函数
假设我们希望 AI 在被问到时 获取天气信息:
functions = [
{
"name": "get_current_weather",
"description": "Retrieve the current weather for a specified location.",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "City and state, e.g., San Francisco, CA.",
},
},
"required": ["location"],
},
}
]
4.3 发起 API 请求
你的 AI 将会 识别何时需要调用函数:
response = openai.ChatCompletion.create(
model="gpt-4",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "What’s the weather like in New York?"},
],
functions=functions,
function_call="auto",
)
4.4 当被调用时执行函数
如果 AI 确定需要获取天气信息,它将触发该函数:
if "function_call" in response["choices"][0]["message"]:
function_name = response["choices"][0]["message"]["function_call"]["name"]
arguments = response["choices"][0]["message"]["function_call"]["arguments"]
if function_name == "get_current_weather":
location = arguments.get("location")
weather_info = get_current_weather(location) # 自定义函数
messages.append({"role": "function", "name": function_name, "content": weather_info})
# 将更新后的响应发送回 OpenAI
response = openai.ChatCompletion.create(
model="gpt-4",
messages=messages,
)
现在,你的 AI 不再只是说 "我不知道",而是会 获取最新的天气信息并智能地回应。
5、为什么这很重要?
在这些更新之前,大多数 AI 系统都是 被动的——它们只是根据文本输入回答问题。而现在,借助 Agents SDK 和 Responses API,你可以构建真正 采取行动 的 AI。
实际应用场景:
- AI 驱动的会计 → 自动化簿记、获取税法、生成报告。
- 客户服务 → AI 可以调用 API 检查订单状态或解决支持工单。
- 自动研究助理 → 获取最新的市场趋势、金融数据或法律更新。
- 企业 AI 聊天机器人 → 让客户无需人工帮助即可预订约会、检查产品可用性或检索发票。
这是 AI 的未来——AI 不仅是对话者,更是行动者。
6、结束语
如果你认真考虑 构建下一代 AI 应用程序,学习使用 OpenAI 的 Agents SDK 和 Responses API 是必须的。
有了这些工具,你可以:
✅ 让 AI 真正自主 → 不再需要手动触发操作。
✅ 构建 AI 助手 → 能够获取、分析和处理真实世界的实际数据。
✅ 创建更智能、交互式的应用 → 能够使用工具、调用 API 并动态响应。
最好的部分? 你现在就可以开始。
原文链接:Mastering OpenAI’s new Agents SDK & Responses API [Part 1]
汇智网翻译整理,转载请标明出处
