MODEL-ZOO Google Colab运行DeepSeek R1 最近我在测试本地运行DeepSeek R1,但CPU温度太高了。我的朋友说你为什么不使用 Google Colab?因为它为你提供了一个 免费GPU。
MODEL-ZOO DeepSeek-R1蒸馏模型 DeepSeek-R1已经在多个基准测试中超越了 SOTA 推理模型 OpenAI-o1。在这篇文章中,我们将深入研究DeepSeek-R1的6 个蒸馏模型。
MODEL-ZOO DeepSeek-R1图形界面Agent指南 本文将指导你完成设置 DeepSeek R1 和 Browser Use 的过程,以创建能够执行复杂任务的 AI 代理,包括 Web 自动化、推理和自然语言交互。
MODEL-ZOO DeepSeek LLM微调指南 在本指南中,我们将介绍使用监督微调 (SFT) 和 Hugging Face 数据集对 DeepSeek LLM 进行微调的过程,并提供针对特定领域数据集进行训练的分步代码演示。
MODEL-ZOO 从零实现2B参数LLM 我们将使用 Pile 数据集从头开始训练一个 20 亿参数的 LLM。结果,我们得到了一个 LLM,它在响应中输出完美的语法和标点符号,较短的上下文有意义,但不是整个响应。