Agents SDK & Responses API

OpenAI 推出了他们的 Agents SDK 和 Responses API——这对像我这样的开发者来说是一个改变游戏规则的工具,它让我们可以构建真正 执行任务 的 AI,而不仅仅是被动地响应。

Agents SDK & Responses API

几个月前,我正埋头在一个复杂的自动化项目中,试图让 AI 代理更加独立。问题是它们需要太多的手动干预。每一步都需要人工提示,这使得自动化感觉……不够自动化。

然后 OpenAI 推出了他们的 Agents SDKResponses API——这对像我这样的开发者来说是一个改变游戏规则的工具,它让我们可以构建真正 执行任务 的 AI,而不仅仅是被动地响应。这些工具让你能够构建 自主使用工具的 AI 代理,它们可以搜索网络、检索文件,甚至调用外部 API 而不需要持续的人类输入。

所以,如果你一直梦想着构建能够独立思考和行动的 AI 系统,那么这个指南就是为你准备的。让我们逐步分解这一切。

1、什么是 OpenAI Agents SDK?

Agents SDK 视为构建能够使用工具并做出决策的 AI 的工具包。它允许你的 AI 代理:

执行多步骤任务(无需你手把手指导)。

集成外部工具(网络搜索、API 调用、数据库)。

自主决定使用哪个工具以及何时使用(基于上下文)。

示例: 想象一下你是一名会计师,正在使用一个 AI 税务助手。它不仅回答问题,还可以:

  • 从政府数据库拉取最新的税法更新
  • 通过调用记账 API 分析财务报表
  • 根据最新数据生成报告

在 Agents SDK 出现之前,实现这一点需要一堆手动 API 调用和复杂的逻辑。现在?它已经内置了。

2、使用OpenAI Agents SDK

2.1 安装 SDK

首先,克隆仓库并安装依赖项:

git clone https://github.com/openai/agent-sdk.git
cd agent-sdk
pip install -r requirements.txt

进入全屏模式

退出全屏模式

2.2 设置你的代理

定义你的 AI 可以使用的工具。假设我们想启用 网络搜索文件检索

from agent_sdk import Agent, WebSearchTool, FileRetrievalTool

search_tool = WebSearchTool(api_key="your_api_key")
file_tool = FileRetrievalTool()

agent = Agent(tools=[search_tool, file_tool])

现在你的代理知道如何搜索网络和获取文档。

2.3 让它自行决策

与传统的聊天机器人不同,这个 AI 根据用户输入决定使用哪个工具

def agent_task(query):
    result = agent.use_tool("web_search", query)
    return result

response = agent_task("最新的 AI 研究论文")
print(response)

无需手动干预——只需 自主执行

3、什么是 OpenAI  Responses API?

Responses API 关注的是如何改进 AI 与用户的交互方式。

它让你的 AI:

动态调用函数(例如,获取天气更新、预订约会)。

返回结构化响应 而不是随机文本。

实时流式传输响应,提供更流畅的用户体验。

可以将其视为给你的 AI 一个更好的界面来与世界互动

4、使用 Responses API 构建更智能的 AI

4.1 设置 API 身份验证

你需要你的 OpenAI API 密钥:

import openai

openai.api_key = "your_api_key"

4.2 定义 AI 可以调用的函数

假设我们希望 AI 在被问到时 获取天气信息

functions = [
    {
        "name": "get_current_weather",
        "description": "Retrieve the current weather for a specified location.",
        "parameters": {
            "type": "object",
            "properties": {
                "location": {
                    "type": "string",
                    "description": "City and state, e.g., San Francisco, CA.",
                },
            },
            "required": ["location"],
        },
    }
]

4.3 发起 API 请求

你的 AI 将会 识别何时需要调用函数

response = openai.ChatCompletion.create(
    model="gpt-4",
    messages=[
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What’s the weather like in New York?"},
    ],
    functions=functions,
    function_call="auto",
)

4.4 当被调用时执行函数

如果 AI 确定需要获取天气信息,它将触发该函数:

if "function_call" in response["choices"][0]["message"]:
    function_name = response["choices"][0]["message"]["function_call"]["name"]
    arguments = response["choices"][0]["message"]["function_call"]["arguments"]

    if function_name == "get_current_weather":
        location = arguments.get("location")
        weather_info = get_current_weather(location)  # 自定义函数
        messages.append({"role": "function", "name": function_name, "content": weather_info})

        # 将更新后的响应发送回 OpenAI
        response = openai.ChatCompletion.create(
            model="gpt-4",
            messages=messages,
        )

现在,你的 AI 不再只是说 "我不知道",而是会 获取最新的天气信息并智能地回应

5、为什么这很重要?

在这些更新之前,大多数 AI 系统都是 被动的——它们只是根据文本输入回答问题。而现在,借助 Agents SDK 和 Responses API,你可以构建真正 采取行动 的 AI。

实际应用场景:

  • AI 驱动的会计 → 自动化簿记、获取税法、生成报告。
  • 客户服务 → AI 可以调用 API 检查订单状态或解决支持工单。
  • 自动研究助理 → 获取最新的市场趋势、金融数据或法律更新。
  • 企业 AI 聊天机器人 → 让客户无需人工帮助即可预订约会、检查产品可用性或检索发票。

这是 AI 的未来——AI 不仅是对话者,更是行动者。

6、结束语

如果你认真考虑 构建下一代 AI 应用程序,学习使用 OpenAI 的 Agents SDKResponses API 是必须的。

有了这些工具,你可以:

让 AI 真正自主 → 不再需要手动触发操作。

构建 AI 助手 → 能够获取、分析和处理真实世界的实际数据。

创建更智能、交互式的应用 → 能够使用工具、调用 API 并动态响应。

最好的部分? 你现在就可以开始。


原文链接:Mastering OpenAI’s new Agents SDK & Responses API [Part 1]

汇智网翻译整理,转载请标明出处