大模型领域正在被再次颠覆

这个现象可以描述为LLM驱动的原生应用程序或原生LLM界面的兴起。

大模型领域正在被再次颠覆

这个现象可以描述为LLM驱动的原生应用程序原生LLM界面的兴起。

这些术语捕捉了当前的趋势,即大型语言模型(LLM)提供商正在构建独立的、面向终端用户的应用程序,旨在直接利用其AI模型为终端用户提供服务,而不仅仅是提供API或后端服务供开发人员集成。

这些是专门为LLM的能力设计的目的性应用程序,类似于专门为移动平台构建的原生移动应用

区域7:终端用户界面

我一直认为基于生成式AI的应用程序在区域7中容易被取代。

我喜欢iOS中手电筒应用的突出地位的例子,以及用户愿意为此付费。只是功能最终被手机操作系统软件中的手电筒所取代。

基于标准可用功能的薄层包装的生成式AI应用程序的时代已经结束。

需要相当多的知识产权和差异化。

从原生LLM界面的颠覆将一定程度上影响区域6——基础工具,因为这是一种自助选择。但用户也会利用它为自己构建终端用户解决方案,因此再次取代区域7中的应用程序。

区域6:基础工具

原生LLM界面包含基础工具区的元素,如搜索、上下文创建、易于使用的嵌入、AI代理构建工具等。

所以我认为LLM原生应用程序擅长抽象关键且重要的技术构建块,并将这些构建块合成到一个无代码到低代码的直观UI中,供用户构建主要针对个人使用的问题解决方案。

存在风险的是专注于单一、私人用途的技术提供商。

然而,也有机会让技术提供商专注于将技术统一到一个无代码到低代码的编排平台。

此外,还有显著的机会来构建企业聚焦的解决方案。

该领域还侧重于利用大型语言模型(LLMs)的工具,如向量存储、交互式数据工作室和高级提示工程平台。

像HuggingFace这样的服务简化了访问,通过无代码模型卡和简单的推理API,使LLM的使用民主化。

这里的一个亮点是数据为中心的工具,旨在推动可重复、高影响力的LLM应用。

最近的创新包括本地离线推理服务器、模型量化和紧凑型语言模型,增强了效率和灵活性。

市场机会在于构建基础工具以满足新兴需求——简化数据交付、增强数据发现和支持数据设计与开发。这些解决方案有望塑造LLM驱动创新的未来。
搜索2.0

LLM提供商优先考虑广泛用户分发的原因之一可以称为搜索2.0,或者答案取代搜索。

语言模型(LLM)提供商正在将重点从以开发者为中心的工具(如API)转向终端用户应用程序,试图主导下一代搜索技术。

这一转变反映了对可访问性和分发的关注,旨在将LLM直接整合到日常用户体验中,而不是仅仅依赖技术集成。

传统的搜索引擎,如Google,擅长索引大量网络内容并提供精确的结果,但LLM提供了新的范例,凭借其理解上下文、综合信息和生成类似人类对话响应的能力。

公司如xAI(拥有Grok)、OpenAI(ChatGPT)和其他公司正在构建原生应用,将这种能力直接带给用户,绕过了第三方开发者需要填补的空白。

这一趋势在Kimi、Deepseek Chat和Qwen等例子中显而易见,它们优先考虑面向用户的界面。

分发是赢得搜索竞赛的关键。

通过将LLM嵌入广泛可访问的平台上,提供商可以捕获更多用户和数据,从而比竞争对手更快地完善其模型。

这与旧的API分发模式形成对比,在旧模式中控制权掌握在开发人员手中。

通用LLM接口(例如Grok或ChatGPT)由于合规性和风险问题,在特定需求方面往往表现不佳。这为业务环境中定制化的下一代搜索解决方案创造了机会。

Grok,ChatGPT,DeepSeek,Kimi

区域5:模型多样化与统一

区域5捕捉了大型语言模型(LLM)演进的格局,其中最初一波的多样化——以专门模型解决特定任务为标志——已经开始收敛到单一、多功能系统的统一能力。

现代模型不再局限于文本生成;它们现在集成了多种模态,如视觉和推理,使其能够处理图像、解释复杂查询并提供多方面的输出。

这种统一的一个显著特征是模型能够展示其推理过程,提供结论如何得出的透明度,这提高了信任和可用性。

统一模型还支持高级功能,如函数调用和结构化数据生成,使其成为创意和技术应用的强大工具。

这种向全能型模型的转变反映了多样性与效率之间的实际平衡,满足了多样化的用户需求,同时简化了部署和开发工作流程。

多样化正让位于具备视觉、推理、可解释性、函数调用和数据结构化能力的统一、多功能模型。

区域4:商业模型提供商

起初,许多人认为OpenAI会主导基于代理的应用程序的大型语言模型(LLM)市场,鉴于其早期的领先优势——ChatGPT和专为自主推理和任务执行设计的强大的API生态系统。

然而,最近几个月,出现了许多新提供商——如xAI的Grok、Anthropic的Claude等——通过提供性能、成本和专业化代理能力相媲美的竞争模型,挑战了这种主导地位。

这一转变很大程度上是由开源倡议推动的,如HuggingFace、Meta AI的LLaMA衍生品以及更小、更高效的模型(如量化或蒸馏版本),这些模型赋予开发人员构建和定制代理的能力,而无需依赖专有系统。

结果,LLM驱动的代理市场变得更加分散,开源势头和创新的新进入者减少了OpenAI曾经预期的垄断地位,同时也加速了代理AI应用的进步。

区域3:特定实现

我发现模型最初专注于解决特定问题很有趣,比如人类语言翻译、对话状态管理等。随着技术的发展,这些元素成为了模型内在的、假设的部分。

这个阶段更具实验性,起到了垫脚石的作用。

区域2:通用用例

随着大型语言模型的到来,功能更加细分……模型被训练用于特定任务。Sphere和Side模型专注于知识回答;Meta称之为KI-NLP的东西。DialoGPT、GODEL、BlenderBot等模型则专注于对话管理。

区域1:语言模型的颠覆

语言模型的出现就像一颗投入我们生活的石子,激起涟漪,引发了新的市场、产品、需求和机会。

这引入了一个全新的提示工程范式,其中非结构化的自然语言被用来指导语言模型,引导其模拟特定的行为或响应。

输出也是非结构化的,作为模型内部处理和组织数据的结果,展示了其从抽象输入中生成有意义结果的能力。

我们后来了解到,语言模型在上下文参考方面表现出色,尽管基本原理在孤立情况下也能很好地工作;扩展这些能力需要创新的方法来处理复杂性和数量。


原文链接:The Language Model Landscape Is Being Disrupted…again

汇智网翻译整理,转载请标明出处