Magnetic-One多智能体框架

又一周，又一个代理框架。AI代理市场似乎既火爆又分散，但创新水平令人瞩目。其中一个似乎正在获得极大关注的领域是多代理系统。微软是代理领域真正活跃的公司之一，拥有 AutoGen 和 TaskWeaver 等框架。最近，微软开源了一个专注于多代理系统的新框架。

Magentic-One 是微软研究院开发的一款新型通用多代理系统，旨在处理基于跨不同领域的网络和文件信息的开放式任务。本文将介绍 Magentic-One 的架构、功能、评估结果和潜在风险。

1、系统架构

Magentic-One 建立在多代理架构之上，其中一个 Orchestrator 代理带领其他四个代理执行任务。这种方法实现了模块化和灵活性，超越了传统单代理系统的功能。

Orchestrator 代理负责：

分解任务并规划其执行。
指导其他代理执行子任务。
监控任务的总体进度。
必要时采取纠正措施。

Magentic-One 采用双循环系统进行任务管理：

外循环：管理任务分类账，其中存储事实、猜测和任务的总体计划。

内循环：处理进度分类账，跟踪任务的当前状态和子任务分配。

Orchestrator 通过制定计划并在任务分类账中记录相关信息来启动流程。然后在进度分类账中跟踪计划的每个步骤。 Orchestrator 将子任务分配给其他代理，监控他们的进度，并相应地更新进度分类账。如果进展不足，Orchestrator 可以调整任务分类账并制定新计划。

2、专门的代理

除了 Orchestrator 之外，Magentic-One 还包括其他四个专门的代理：

WebSurfer：经过训练可以与 Web 浏览器交互的代理，能够进行导航、网页操作和信息提取。 WebSurfer 利用浏览器的可访问性树和提示技术来完成其操作。
FileSurfer：擅长使用基于 markdown 的文件预览应用程序读取和导航各种类型的本地文件的代理。该代理可以列出目录内容并在文件夹结构内移动。
Coder：专门用于编写代码、分析来自其他代理的数据以及创建新输出的代理。
ComputerTerminal：该代理提供对控制台 shell 的访问，用于执行 Coder 生成的代码并安装必要的编程库。

3、模型灵活性

Magentic-One 的设计与模型无关。虽然所有代理的默认模型都是 GPT-4o，但不同的配置可以利用各种大型语言模型 (LLM) 和专用语言模型 (SLM)。这种适应性确保 Magentic-One 可以针对特定任务和资源限制进行优化。

以下代码演示了 Magentic-One 代理如何交互：

# 初始化 Magentic-One 代理
from autogen.magentic_one import MagenticOneAgent
orchestrator = MagenticOneAgent()
# 定义任务
task = "从互联网下载文件，执行代码与文件交互"
# 运行任务
orchestrator.run(task)

4、评估

使用 AutoGenBench（一种为评估代理系统而开发的工具）评估 Magentic-One 的性能。评估所选择的基准是 GAIA、AssistantBench 和 WebArena，每个基准都涉及需要规划和使用 Web 浏览器的多步骤任务。

结果表明，与其他最先进的方法相比，Magentic-One 表现出了竞争性的性能。它在 GAIA 和 AssistantBench 上实现了与现有方法在统计上相似的结果，同时在 WebArena 上表现出了竞争性的性能。

5、一些风险

像 Magentic-One 这样的代理系统的功能增强带来了潜在的风险。由于 Magentic-One 在现实世界中运行，其行为可能会产生意想不到的后果。观察到的风险示例包括：

重复登录尝试导致帐户被暂停。
尝试通过社交媒体或电子邮件让人类参与任务。

为了应对这些风险，微软实施了各种缓解措施策略：

红队演习以识别潜在漏洞。
使用 Magentic-One 的安全指南和最佳实践。
监控和监督机制。
强调使用具有生成前和生成后过滤的对齐模型。

6、接下来是什么？

代理系统和安全方面的未来研究可能会集中在：

预测新出现的风险，包括网络钓鱼和错误信息攻击。
开发机制让代理了解其行为的可逆性。
集成人机交互系统以用于关键决策点。

Magentic-One 标志着代理系统领域的重大进步，能够解决基于 Web 和文件的环境中的复杂任务。其多代理架构、模块化和与模型无关的设计提供了灵活性和适应性。虽然存在潜在风险，但持续的研究和缓解措施对于确保负责任和安全地开发这种强大的 AI 系统至关重要。

原文链接：Meet Magentic-One: Microsoft’s New Multi-Agent Framework for Solving Complex Tasks

汇智网翻译整理，转载请标明出处