TOOL 用Unsloth训练自己的R1推理模型 DeepSeek 的 R1 研究揭示了一个“顿悟时刻”,其中 R1-Zero 通过使用群组相对策略优化 (GRPO) 自主学习分配更多思考时间而无需人工反馈。你就可以使用 Unsloth和Qwen2.5 (1.5B) 在仅 7GB 的 VRAM 上重现 R1-Zero 的“顿悟时刻”。
TOOL OpenAI Operator 本文通过具有桌面和浏览器访问的 AI 代理的视角探索 OpenAI Operator,重点关注准确性、人工监督以及模型 (CUA) 和框架 (Operator) 之间的区别。
TOOL ComfyUI-PromptOptimizer ComfyUI-PromptOptimizer 旨在优化文本转图像模型的提示。它将用户输入的提示转换为更详细、更多样化、更生动的描述,使其更适合生成高质量的图像。无需本地模型。
TOOL ComfyUI-Pollinations免费文生图 ComgyUI-Pollications自定义节点允许你在 ComfyUI 工作流中直接使用 Pollinations 的强大 AI 模型生成图像。无需自己下载模型,也无需 API 密钥。