MODEL-ZOO - Software 2.0 (Page 2) - 汇智网

Tagged

MODEL-ZOO

A collection of 154 posts

DeepSeek-R1对AI模型市场的影响

DeepSeek-R1对AI模型市场的影响

DeepSeek 引发的股市抛售是盲目恐慌，还是终结的开始？

DeepSeek现象解密

为什么 DeepSeek 能席卷 AI 世界，而 Qwen2.5-Max 和 Qwen Chat 却难以引起同样的轰动？

Gemini 2.0 Flash vs. DeepSeek R1

Gemini 2.0 Flash vs. DeepSeek R1

当我第一次看到 Google Gemini 的价格时，我打算将它与精简版、性能较弱的 R1 型号进行对比。我完全不相信即如此便宜的模型会如此强大。

DeepSeek-R1的推理能力分析

DeepSeek-R1的推理能力分析

DeepSeek 提出了一个模型，该模型的推理能力可与 OpenAI-o1 相媲美，尽管其参数只是 OpenAI-o1 的一小部分，训练成本也低得多。

DeepSeek GRPO vs. OpenAI RLHF

DeepSeek GRPO vs. OpenAI RLHF

DeepSeek使用简单的强化学习（GRPO）来训练像 DeepSeek-R1 这样的 LLM，本文将尝试了解GRPO与OpenAI使用的RLHF强化学习有何不同。

DeepSeek-R1的3个关键思想

DeepSeek-R1的3个关键思想

大多数新的 AI 模型感觉都像是小步。DeepSeek R1 则不同。这是近期第一个让你停下来思考的模型，这可能很重要。

蒸馏DeepSeek-R1到自己的模型

蒸馏DeepSeek-R1到自己的模型

在本博客中，我们将介绍如何使用LoRA等技术将 DeepSeek-R1 的推理能力蒸馏到较小的模型（如 Microsoft 的 Phi-3-Mini）中。

DeepSeek-R1本地运行成本

DeepSeek-R1本地运行成本

DeepSeek 将这场生成竞赛提升到了另一个水平，人们甚至准备在本地运行 671B 参数。但在本地运行如此庞大的模型可不是开玩笑；你需要在硬件方面取得一些重大进步，才能尝试推理。

DeepSeek-R1 671B本地运行指南

DeepSeek-R1 671B本地运行指南

原始的 DeepSeek R1 是一个 6710 亿参数的语言模型，由 Unsloth AI 团队进行了动态量化，大小减少了 80%（从 720 GB 减少到 131 GB），同时保持了强大的性能。

OpenAI o3-mini vs. DeepSeek R1

OpenAI o3-mini vs. DeepSeek R1

DeepSeek 发布 R1 后，我承认我给了 OpenAI 很多批评。从极其昂贵的价格到完全搞砸的 Operator，再到发布一个缓慢、无法使用的伪装成 AI 代理的玩具，OpenAI 在 1 月份已经遭受了很多失败。

DeepSeek GRPO强化学习算法

DeepSeek GRPO强化学习算法

GRPO（组相对策略优化）是强化学习 (RL) 中使用的一种方法，通过比较不同的动作并使用一组观察结果进行小的受控更新来帮助模型更好地学习。

复现DeepSeek-R1的顿悟时刻

复现DeepSeek-R1的顿悟时刻

在这篇博文中，我们想使用群组相对策略优化 (GRPO) 和倒计时游戏重现 DeepSeek-R1 的小“顿悟时刻”。

用Kokoro TTS制作AI配音

用Kokoro TTS制作AI配音

如果我告诉你，现在可以完全免费使用一种不仅好而且可能比 ElevenLabs 等行业领先（且昂贵）服务更好的工具来创建专业品质的 AI 配音，你会怎么想？听起来好得令人难以置信？

DeepSeek R1-Zero & R1分析

DeepSeek R1-Zero & R1分析

借助 DeepSeek 最新发表的研究，我们可以更好地进行推测。关键见解是，LLM 推理系统更高程度的新颖性适应性（和可靠性）是在三个维度上实现的。

CLIP模型微调简明教程

CLIP 是一种流行的多模态嵌入模型，它使用对比学习在大量图像-标题对语料库上进行训练。 CLIP可以解锁零样本能力，例如图像分类、搜索和字幕。

DeepSeek-R1微调指南

DeepSeek-R1微调指南

在这篇博文中，我们将逐步指导你在消费级 GPU 上使用 LoRA（低秩自适应）和 Unsloth 对 DeepSeek-R1 进行微调。

Google Colab运行DeepSeek R1

Google Colab运行DeepSeek R1

最近我在测试本地运行DeepSeek R1，但CPU温度太高了。我的朋友说你为什么不使用 Google Colab？因为它为你提供了一个免费GPU。

DeepSeek R1推理能力的训练配方

DeepSeek R1推理能力的训练配方

DeepSeek R1 的训练分为 4 个阶段，本文将每个训练阶段分解为其核心组件、见解和未解决的问题。

4个运行DeepSeek R1的方法

4个运行DeepSeek R1的方法

如果你想在自己控制的基础设施上托管 DeepSeek 模型，我会告诉你怎么做！

推理模型 vs. 其他AI模型

推理模型 vs. 其他AI模型

推理模型模拟人类如何逻辑地解决问题，提供可解释性和结构化决策。但是，推理模型与其他 AI 范式（例如统计或深度学习模型）有何不同？

DeepSeek Janus系列多模态模型

DeepSeek Janus系列多模态模型

DeepSeek 的 Janus 系列是一种先进的开源多模态 AI 模型，它将图像理解、文本到图像生成和视觉语言推理统一到一个系统中。

DeepSeek Janus Pro 7B

DeepSeek Janus Pro 7B

在本文中，我们将探讨 Janus-Pro-7B 的架构、功能、训练方法和潜在应用。此外，我们将提供在实际应用中利用此模型的代码片段。

DeepSeek R1 + Claude Sonnet

DeepSeek R1 + Claude Sonnet

我的想法是提供来自 DeepSeek 的思维链，帮助 Sonnet 表现更好。

DeepSeek-R1训练过程解密

DeepSeek-R1训练过程解密

作为一个花大量时间与 LLM 合作并指导他人如何使用它们的人，我决定仔细研究一下 DeepSeek-R1 的训练过程。

DeepSeek-R1蒸馏模型

DeepSeek-R1蒸馏模型

DeepSeek-R1已经在多个基准测试中超越了 SOTA 推理模型 OpenAI-o1。在这篇文章中，我们将深入研究DeepSeek-R1的6 个蒸馏模型。