DeepSeek现象解密
为什么 DeepSeek 能席卷 AI 世界,而 Qwen2.5-Max 和 Qwen Chat 却难以引起同样的轰动?

为什么 DeepSeek 能席卷 AI 世界,而 Qwen2.5-Max 和 Qwen Chat 却难以引起同样的轰动?
在过去两周里,DeepSeek 的抱负不知何故让西方大吃一惊。它被描述为斯普特尼克时刻,也是对美国的警钟,等等。
我认为炒作是由于这个领域的大多数人不了解或对市场没有基本的了解。
看看下面这张来自《人工智能分析》的幻灯片,它显示了自 2024 年 12 月 16 日起的质量指数。

DeepSeek V2.5 领先于 AI21Labs 和 Cohere,这已经是一项重大成就;指数为 72。
Qwen 2.5 模型在指数上位于 77,领先于 GPT-4o 和 GPT-4o mini 等模型。
因此,DeepSeek 和 Qwen 都在性能上取得了显著的飞跃,但无论如何,这都不是凭空而来的。
关于中国主导地位的问题,从下图中也可以清楚地看出,美国已经牢固确立,而美国的主导地位绝不会就此结束。除此之外,从 DeepSeek-R1 的基础上,DeepSeek AI 创建了一系列基于 Meta 的 Llama 和 Qwen 架构的精简模型,参数范围从 15 亿到 700 亿不等。
从下图可以看出,同样从人工智能分析中可以看出,专有和开源模型的模型质量正在显着提高。

而且差距正在缩小……o1 在 2024 年底实现了相当大的飞跃,我们肯定会看到更多即将到来的质量和性能飞跃。
1、捕捉想象力
那么 DeepSeek 为何能吸引公众的想象力呢?
很可能不是因为 DeepSeek V3 和 R1 是开源的,也不是因为 DeepSeek V3 相对于其同类产品的出色基准性能。

我认为 DeepSeek 引起普遍兴奋的主要原因和原因是他们的 Web UI,它类似于 ChatGPT。具有与 ChatGPT 相同的基本功能,但增加了内部推理的流式传输和 UI 的上下文管理。
这是一个非常聪明的用户体验技巧,可以在模型计算出最终答案时吸引用户,但在用户看到内部推理时提供一定程度的透明度和敬畏感。
OpenAI 已经有推理模型一段时间了,它可以管理对话的上下文,但它并没有像 DeepSeek 那样显示出来。
UI 还使更广泛的公众能够进行实验,从而让大多数人都能获得个人体验,并暗示分享观点。

有危言耸听的帖子说,如果你使用 DeepSeek,你就把你王国的钥匙交给了中国,所有的用户数据都会转发到中国的 DeepSeek 等等。
请阅读以下内容……
2、DeepSeek R1/V3:具有完全数据控制的开源 AI
DeepSeek R1/V3 是开源 AI 模型,可以私人或商业托管,提供对数据治理和安全的完全控制。
这些模型在自托管时独立于 DeepSeek 公司运行,确保当你部署私有实例时,你的数据(提示)保留在你的基础设施中,而不会发送到 DeepSeek 的服务器:
- DeepSeek R1/V3 → 可自行托管以实现完全隐私和自定义的开源模型。
- DeepSeek-Chat(应用程序和网站)→ 一个公开可用的聊天界面(类似于 ChatGPT),允许用户通过 DeepSeek 的服务器与 AI 模型进行交互。使用此服务时,你的数据由 DeepSeek 的基础设施处理。
3、Perplexity CEO Aravind Srinivas 的见解
Perplexity 首席执行官 Aravind Srinivas 阐明了独立托管 DeepSeek R1/V3 的重要性:
- 完全控制 AI 推理:当组织在自己的服务器上下载和托管 DeepSeek 模型时,所有 AI 推理都在本地进行,确保数据不会离开其基础设施。
- 无需外部计算:AI 模型可以完全在托管服务器上生成响应,这意味着在推理期间无需将数据发送到外部位置(例如中国或其他地方)。
- 企业定制:公司可以通过将网络搜索、外部工具(例如代码执行、Wolfram Alpha)或其他功能集成到其托管实例中来进一步定制 AI。
DeepSeek R1/MoE 为寻求隐私优先 AI 部署的组织提供了强大的开源替代方案。虽然 DeepSeek-Chat 提供了方便的基于 Web 的界面,但自托管可确保企业和研究人员能够完全控制他们的数据、优化模型推理并定制功能以满足他们的需求。
4、Qwen2.5-Max
所以这里才是真正有趣的地方……
阿里巴巴于 2025 年 1 月 28 日推出了 Qwen2.5-Max 模型,考虑到下面的图表,Qwen2.5-Max 在所有基准测试中都超过了 DeepSeek V3。

此外,阿里巴巴推出了 Qwen Chat,它基本上是 DeepSeek Chat 的克隆版,采用相同的策略来流式传输模型的内部推理。

该模型也可通过阿里云和 HuggingFace 获得,Qwen2.5-Max 和 DeepSeek V3 之间的唯一区别是 Qwen2.5-Max 不是开源的。从我自己的随意测试来看,似乎没有像 DeepSeek 那样存在任何政治审查。
5、真正的危险
我想说真正的危险是员工使用 ChatGPT、Cohere Coral、DeepSeek Chat、Qen Chat 等托管解决方案进行商业用途或个人用途,处理敏感数据。
我没有任何理由认为这些公司参与了任何邪恶行为。但从企业数据治理的角度来看,拥有一个包含所有必需元素的定制企业解决方案是有意义的。
6、结束语
那么为什么 DeepSeek 被炒作,而阿里巴巴的努力却没有?DeepSeek 是开源的,这是它被视为中国特洛伊木马的原因吗?
也许答案就在新闻周期的某个地方……例如,我认为 OpenAI Operator 比 Anthropic 的 Computer Use AI Agent 受到的媒体关注要多得多。
与 OpenAI Operator 相比,Computer Use AI Agent 实际上是一个非常全面的框架,并且真正展示了一定程度的 PC 自主性。然而,关于 Operator 的新闻炒作要大得多。至少在我看来是这样。
所以我想说,找到新闻来源和看穿炒作并描绘平衡图景的人。我认为大多数新闻来源的技术理解至少是值得怀疑的。
原文链接:The DeepSeek Phenomenon Demystified
汇智网翻译整理,转载请标明出处