LIBRARY

Agents SDK & Responses API

OpenAI 推出了他们的 Agents SDK 和 Responses API——这对像我这样的开发者来说是一个改变游戏规则的工具，它让我们可以构建真正执行任务的 AI，而不仅仅是被动地响应。

admin

Mar 15, 2025 • 5 min read

几个月前，我正埋头在一个复杂的自动化项目中，试图让 AI 代理更加独立。问题是它们需要太多的手动干预。每一步都需要人工提示，这使得自动化感觉……不够自动化。

然后 OpenAI 推出了他们的 Agents SDK 和 Responses API——这对像我这样的开发者来说是一个改变游戏规则的工具，它让我们可以构建真正 执行任务 的 AI，而不仅仅是被动地响应。这些工具让你能够构建 自主使用工具的 AI 代理，它们可以搜索网络、检索文件，甚至调用外部 API 而不需要持续的人类输入。

所以，如果你一直梦想着构建能够独立思考和行动的 AI 系统，那么这个指南就是为你准备的。让我们逐步分解这一切。

1、什么是 OpenAI Agents SDK？

将 Agents SDK 视为构建能够使用工具并做出决策的 AI 的工具包。它允许你的 AI 代理：

✅ 执行多步骤任务（无需你手把手指导）。

✅ 集成外部工具（网络搜索、API 调用、数据库）。

✅ 自主决定使用哪个工具以及何时使用（基于上下文）。

示例： 想象一下你是一名会计师，正在使用一个 AI 税务助手。它不仅回答问题，还可以：

从政府数据库拉取最新的税法更新。
通过调用记账 API 分析财务报表。
根据最新数据生成报告。

在 Agents SDK 出现之前，实现这一点需要一堆手动 API 调用和复杂的逻辑。现在？它已经内置了。

2、使用OpenAI Agents SDK

2.1 安装 SDK

首先，克隆仓库并安装依赖项：

git clone https://github.com/openai/agent-sdk.git
cd agent-sdk
pip install -r requirements.txt

进入全屏模式

退出全屏模式

2.2 设置你的代理

定义你的 AI 可以使用的工具。假设我们想启用 网络搜索 和 文件检索：

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=[search_tool, file_tool])

现在你的代理知道如何搜索网络和获取文档。

2.3 让它自行决策

与传统的聊天机器人不同，这个 AI 根据用户输入决定使用哪个工具：

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("最新的 AI 研究论文")
print(response)

无需手动干预——只需 自主执行。

3、什么是 OpenAI Responses API？

Responses API 关注的是如何改进 AI 与用户的交互方式。

它让你的 AI：

✅ 动态调用函数（例如，获取天气更新、预订约会）。

✅ 返回结构化响应 而不是随机文本。

✅ 实时流式传输响应，提供更流畅的用户体验。

可以将其视为给你的 AI 一个更好的界面来与世界互动。

4、使用 Responses API 构建更智能的 AI

4.1 设置 API 身份验证

你需要你的 OpenAI API 密钥：

import openai

openai.api_key = "your_api_key"

4.2 定义 AI 可以调用的函数

假设我们希望 AI 在被问到时 获取天气信息：

functions = [
    {
        "name": "get_current_weather",
        "description": "Retrieve the current weather for a specified location.",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {
                    "type": "string",
                    "description": "City and state, e.g., San Francisco, CA.",
                },
            },
            "required": ["location"],
        },
    }
]

4.3 发起 API 请求

你的 AI 将会 识别何时需要调用函数：

response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What’s the weather like in New York?"},
    ],
    functions=functions,
    function_call="auto",
)

4.4 当被调用时执行函数

如果 AI 确定需要获取天气信息，它将触发该函数：

if "function_call" in response["choices"][0]["message"]:
    function_name = response["choices"][0]["message"]["function_call"]["name"]
    arguments = response["choices"][0]["message"]["function_call"]["arguments"]

    if function_name == "get_current_weather":
        location = arguments.get("location")
        weather_info = get_current_weather(location)  # 自定义函数
        messages.append({"role": "function", "name": function_name, "content": weather_info})

        # 将更新后的响应发送回 OpenAI
        response = openai.ChatCompletion.create(
            model="gpt-4",
            messages=messages,
        )

现在，你的 AI 不再只是说 "我不知道"，而是会 获取最新的天气信息并智能地回应。

5、为什么这很重要？

在这些更新之前，大多数 AI 系统都是 被动的——它们只是根据文本输入回答问题。而现在，借助 Agents SDK 和 Responses API，你可以构建真正 采取行动 的 AI。

实际应用场景：

AI 驱动的会计 → 自动化簿记、获取税法、生成报告。
客户服务 → AI 可以调用 API 检查订单状态或解决支持工单。
自动研究助理 → 获取最新的市场趋势、金融数据或法律更新。
企业 AI 聊天机器人 → 让客户无需人工帮助即可预订约会、检查产品可用性或检索发票。

这是 AI 的未来——AI 不仅是对话者，更是行动者。

6、结束语

如果你认真考虑 构建下一代 AI 应用程序，学习使用 OpenAI 的 Agents SDK 和 Responses API 是必须的。

有了这些工具，你可以：

✅ 让 AI 真正自主 → 不再需要手动触发操作。

✅ 构建 AI 助手 → 能够获取、分析和处理真实世界的实际数据。

✅ 创建更智能、交互式的应用 → 能够使用工具、调用 API 并动态响应。

最好的部分？ 你现在就可以开始。

原文链接：Mastering OpenAI’s new Agents SDK & Responses API [Part 1]

汇智网翻译整理，转载请标明出处