MODEL-ZOO SAM 3D:从单张图像抽取3D模型 Meta 的新 SAM 3D 不再仅仅了解照片中的内容。它了解事物在 3D 空间中的位置。单击照片中的咖啡杯,它会返回完整的 3D 网格。指向一个人,你就可以得到他们完整的身体姿势和形状。
APPLICATION 用代码生成优化MCP调用成本 Anthropic 和 Cloudflare 的工程团队独立地发现了大幅降低MCP调用成本的相同解决方案:停止让模型直接调用MCP工具,而是让它们编写代码。
TOOL Google ADK 可视化AI代理构建器 Google ADK v1.18.0 引入了可视化AI代理构建器——一个基于浏览器的界面,让您可以通过拖放交互和自然语言对话来设计、配置和测试复杂的多代理系统。
LIBRARY RAG神器:Gemini文件搜索工具 Google在 Gemini API 中悄然推出了一款全新的文件搜索工具,它可以帮您处理所有繁重的 RAG 工作。您只需上传文件,提出问题,剩下的就交给它来搞定。
APPLICATION 用 LangGraph 构建 AI 交易代理 我想分享一个我特别兴奋的项目:一个自动化的金融交易代理。它是一个有状态的、自我指导的代理,能够推理目标、执行一系列金融分析步骤,并决定何时完成工作。
APPLICATION Qwen-image-edit 本地部署实践 我们尝试在搭载 AMD Ryzen AI Max+395 和 Intel Core Ultra 125H 的 AI PC 上本地运行 Qwen-Image-Edit 模型,以执行典型的照片编辑任务。
MODEL-ZOO Kimi K2 Thinking Moonshot AI 的基准测试成绩,显示 K2 Thinking 在“代理推理”和“代理搜索”方面击败了顶级的 OpenAI 和 Anthropic 模型,但在“编码”方面并未达到顶尖水平。
MODEL-ZOO FIBO - Nano Banana的开源对手 作为第一个原生支持JSON的图像生成模型,FIBO为每个渲染提供了可追溯性、可审计性和精确的可编辑性,专为代理、自动化和专业设计工作流程而构建。