MODEL-ZOO DeepSeek-R1蒸馏模型 DeepSeek-R1已经在多个基准测试中超越了 SOTA 推理模型 OpenAI-o1。在这篇文章中,我们将深入研究DeepSeek-R1的6 个蒸馏模型。
MODEL-ZOO DeepSeek-R1图形界面Agent指南 本文将指导你完成设置 DeepSeek R1 和 Browser Use 的过程,以创建能够执行复杂任务的 AI 代理,包括 Web 自动化、推理和自然语言交互。
MODEL-ZOO DeepSeek LLM微调指南 在本指南中,我们将介绍使用监督微调 (SFT) 和 Hugging Face 数据集对 DeepSeek LLM 进行微调的过程,并提供针对特定领域数据集进行训练的分步代码演示。
MODEL-ZOO 从零实现2B参数LLM 我们将使用 Pile 数据集从头开始训练一个 20 亿参数的 LLM。结果,我们得到了一个 LLM,它在响应中输出完美的语法和标点符号,较短的上下文有意义,但不是整个响应。
MODEL-ZOO 微调PaliGemma优化目标检测 虽然 PaliGemma 具有零样本能力(这意味着模型无需微调即可识别物体),但这种能力是有限的。Google 强烈建议对模型进行微调,以在特定领域获得最佳性能。
MODEL-ZOO Llama Guard保障LLM对话安全 LLM对话安全在这里指的是保护整个客户体验—不允许他们查看个人信息,防范有毒内容、有害内容,以及基本上任何他们不应该看到但不会影响他们整体体验的内容。