Perplexity Sonar Reasoning
我在浏览OpenRouter时看到了一个我之前从未见过的模型:Perplexity Sonar Reasoning,这是一个令人震惊的预置实时网络搜索能力的大模型。

大型语言模型的一个致命弱点,就是它们没有实时访问信息的能力。为了让LLMs访问网络,你必须集成非常昂贵的第三方提供商,进行大量的API调用,并且忘记你的模型会在几秒钟内响应的想法。
或者至少我是这么认为的。
我在浏览OpenRouter时看到了一个我之前从未见过的模型:Perplexity Sonar Reasoning。虽然我知道Perplexity是LLM驱动的Google搜索替代品,但我不知道它有LLM API。
所以我想试试它,看看它是否可以取代我在AI平台中启用实时网络搜索所需的一些逻辑。
结果让我震惊了。为什么没有人谈论这个??
1、我当前基于实时查询的方法
为了在Perplexity与其他LLMs之间进行公平比较,你必须将其与设计用于获取实时信息的基础设施进行比较。
在我的平台NexusTrade中,其中一个功能就是能够询问有关实时股市事件的问题。

要获取这些信息,我构建了一个基础设施,该基础设施使用股票新闻API和多个LLM调用来获取实时信息。
具体来说:
- LLM生成一个指向StockNewsAPI的URL
- 使用URL(以及我的API令牌)执行GET请求以检索用户问题的相关实时新闻
- 获取结果并格式化主要事件为表格
- 此外,我将相同的结果格式化为项目符号列表和摘要段落
- 将结果组合成一个响应并发送回用户

这种方法非常准确,几乎保证了对实时新闻来源的访问。

但它是复杂的,并且需要访问API,这会花费我一些美分。所以我的问题是……Perplexity能做得更好吗?
2、向Perplexity提出相同的问题
为了看看Perplexity Sonar Pro是否和我的方法一样好,我问了它同样的问题:
下周市场应该知道什么?
模型的响应很好。非常好。

首先,模型“思考”了我的问题。与其他思维模型不同,该模型似乎在每个思维链中都访问了网络。
然后,模型制定了最终的响应。

诚然,这个响应比我上面提到的复杂方法更好。它实际上直接回答了我的问题,并指出了我的方法遗漏的内容,例如投资者应留意的事件,如ISM制造业和ADM就业。
一个通用模型击败了一个专门为此任务构建的模型?我很震惊。
3、Perplexity模型的缺点
尽管Perplexity模型的响应明显优于我的原始基于查询的方法,但Perplexity模型确实有一些缺点。
3.1 成本
每百万输入令牌1美元,每百万输出令牌5美元的成本使得Perplexity模型相当昂贵,尤其是与DeepSeek R1和Gemini Flash 2.0等性能相当的模型相比(但没有实时网络访问)。

3.2 缺乏来源
除非我非常迟钝,否则似乎不可能通过API访问Perplexity使用的来源。无论我是通过OpenRouter使用还是直接使用API,似乎也是如此。对于需要准确性的金融信息而言,这是不可接受的。
3.3 缺乏控制
最后,虽然Perplexity方法在处理通用问题时表现出色,但如果用户提出非常具体的问题,则效果不佳。
例如,我问它:
NVDA和Intel的市场情况如何?只包括同时涉及这两家公司的来源,并且仅限最近一周的结果。

由于它只是从相关性顺序上搜索网络(而不是调用API),因此无法准确回答问题。模型找到的搜索结果并非来自3月1日至3月8日,因此不符合我的要求。
相比之下,基于查询的方法工作得非常好。

正如我们所见,两种方法各有优缺点。
那么如果我们将它们结合起来呢?
4、两者的结合
我不能仅仅忽视Perplexity响应的惊人之处。如果有人可以使用一个成本只有几分钱的API击败我的专门构建的应用程序,那么我的应用程序还有什么意义?
所以我将它们结合在一起。
我决定将网络搜索与金融新闻API结合起来。最终结果是一种极其全面的分析,包括来源、项目符号和结果表。
为了让它更易于消化,我还添加了一个TL;DR,即给模型的一切提供一个一句话总结。

这样,投资者就可以获得两者最好的东西。在大多数情况下,额外的延迟(用户通常不会注意到)并不重要,他们拥有来自新闻API的实时信息和来自Perplexity的出色总结。这是一个双赢!
5、结论性思考
随着所有AI巨头相互竞争,Perplexity的宣布可能被掩盖了。
但这是一款改变游戏规则的模型。
这是一个由大型语言模型引发的令人惊叹的创新例子。能够以几乎无需设置的方式实时访问网络,在某些用例中是一个改变游戏规则的功能。虽然我当然不会在我的应用程序中的每个LLM用例中都使用它,但股票新闻查询器正是它完美契合的例子。它为我的应用程序提供了我所需的实时信息。
总体而言,我对这些模型在未来的发展感到兴奋。微软是否会发布一款完全取代使用金融API查询实时股票信息需求的人工智能模型?
只有时间能告诉我们答案。
汇智网翻译整理,转载请标明出处
