Magnetic-One多智能体框架
又一周,又一个代理框架。AI代理市场似乎既火爆又分散,但创新水平令人瞩目。其中一个似乎正在获得极大关注的领域是多代理系统。微软是代理领域真正活跃的公司之一,拥有 AutoGen 和 TaskWeaver 等框架。最近,微软开源了一个专注于多代理系统的新框架。
Magentic-One 是微软研究院开发的一款新型通用多代理系统,旨在处理基于跨不同领域的网络和文件信息的开放式任务。本文将介绍 Magentic-One 的架构、功能、评估结果和潜在风险。
1、系统架构
Magentic-One 建立在多代理架构之上,其中一个 Orchestrator 代理带领其他四个代理执行任务。这种方法实现了模块化和灵活性,超越了传统单代理系统的功能。
Orchestrator 代理负责:
- 分解任务并规划其执行。
- 指导其他代理执行子任务。
- 监控任务的总体进度。
- 必要时采取纠正措施。
Magentic-One 采用双循环系统进行任务管理:
外循环:管理任务分类账,其中存储事实、猜测和任务的总体计划。
内循环:处理进度分类账,跟踪任务的当前状态和子任务分配。
Orchestrator 通过制定计划并在任务分类账中记录相关信息来启动流程。然后在进度分类账中跟踪计划的每个步骤。 Orchestrator 将子任务分配给其他代理,监控他们的进度,并相应地更新进度分类账。如果进展不足,Orchestrator 可以调整任务分类账并制定新计划。
2、专门的代理
除了 Orchestrator 之外,Magentic-One 还包括其他四个专门的代理:
- WebSurfer:经过训练可以与 Web 浏览器交互的代理,能够进行导航、网页操作和信息提取。 WebSurfer 利用浏览器的可访问性树和提示技术来完成其操作。
- FileSurfer:擅长使用基于 markdown 的文件预览应用程序读取和导航各种类型的本地文件的代理。该代理可以列出目录内容并在文件夹结构内移动。
- Coder:专门用于编写代码、分析来自其他代理的数据以及创建新输出的代理。
- ComputerTerminal:该代理提供对控制台 shell 的访问,用于执行 Coder 生成的代码并安装必要的编程库。
3、模型灵活性
Magentic-One 的设计与模型无关。虽然所有代理的默认模型都是 GPT-4o,但不同的配置可以利用各种大型语言模型 (LLM) 和专用语言模型 (SLM)。这种适应性确保 Magentic-One 可以针对特定任务和资源限制进行优化。
以下代码演示了 Magentic-One 代理如何交互:
# 初始化 Magentic-One 代理
from autogen.magentic_one import MagenticOneAgent
orchestrator = MagenticOneAgent()
# 定义任务
task = "从互联网下载文件,执行代码与文件交互"
# 运行任务
orchestrator.run(task)
4、评估
使用 AutoGenBench(一种为评估代理系统而开发的工具)评估 Magentic-One 的性能。评估所选择的基准是 GAIA、AssistantBench 和 WebArena,每个基准都涉及需要规划和使用 Web 浏览器的多步骤任务。
结果表明,与其他最先进的方法相比,Magentic-One 表现出了竞争性的性能。它在 GAIA 和 AssistantBench 上实现了与现有方法在统计上相似的结果,同时在 WebArena 上表现出了竞争性的性能。
5、一些风险
像 Magentic-One 这样的代理系统的功能增强带来了潜在的风险。由于 Magentic-One 在现实世界中运行,其行为可能会产生意想不到的后果。观察到的风险示例包括:
- 重复登录尝试导致帐户被暂停。
- 尝试通过社交媒体或电子邮件让人类参与任务。
为了应对这些风险,微软实施了各种缓解措施策略:
- 红队演习以识别潜在漏洞。
- 使用 Magentic-One 的安全指南和最佳实践。
- 监控和监督机制。
- 强调使用具有生成前和生成后过滤的对齐模型。
6、接下来是什么?
代理系统和安全方面的未来研究可能会集中在:
- 预测新出现的风险,包括网络钓鱼和错误信息攻击。
- 开发机制让代理了解其行为的可逆性。
- 集成人机交互系统以用于关键决策点。
Magentic-One 标志着代理系统领域的重大进步,能够解决基于 Web 和文件的环境中的复杂任务。其多代理架构、模块化和与模型无关的设计提供了灵活性和适应性。虽然存在潜在风险,但持续的研究和缓解措施对于确保负责任和安全地开发这种强大的 AI 系统至关重要。
原文链接:Meet Magentic-One: Microsoft’s New Multi-Agent Framework for Solving Complex Tasks
汇智网翻译整理,转载请标明出处