提示工程:从思维链到草稿链

草稿链(Chain of Draft)是一种旨在简化推理而不牺牲准确性的提示技术。可以将其视为更详细的思维链(CoT)方法的“言简意赅”版本。

提示工程:从思维链到草稿链

几个月来,思维链(CoT)一直是任何使用LLM或ChatGPT的人的首选提示技术。我一直发现CoT的一个问题是其冗长。

它生成了太多的标记。

你问ChatGPT一个简单的问题,却得到一篇论文作为回答吗?这就是 草稿链(CoD)的作用——一种旨在简化推理而不牺牲准确性的提示技术。可以将其视为更详细的思维链(CoT)方法的“言简意赅”版本。让我们分解一下!

1、什么是草稿链(CoD)?

CoD是一种优先考虑简洁推理步骤的提示方法,以提高效率。与CoT不同,后者详细地走完每一步,CoD专注于仅提供解决问题所需的关键信息。这意味着:

  • 减少冗长——没有过多的解释。
  • 减少标记数——降低计算成本。
  • 更快的响应——适用于实时应用的理想选择。

简单示例

样本提示

让我们使用一个基本的数学问题来比较不同的提示技术:

问题: 杰森有20个棒棒糖。他给了丹尼一些。现在他还剩下12个。杰森给了丹尼多少个棒棒糖?

标准提示(直接答案)

  • 回复: 8

思维链(CoT)提示(逐步解释)

  • 回复:
杰森一开始有20个棒棒糖。

给了一些之后,他剩下12个。

要找出他给了多少,我们做减法:20 - 12。

这给出了8

草稿链(CoD)提示(简洁推理)

  • 回复: 20 - 12 = 8 → 最终答案:8.
看到区别了吗?CoT是全面的,但可能过于繁琐。CoD去除了不必要的部分,保留清晰度的同时节省时间。

2、指标和基准

如您所见,CoD似乎是现实问题的解决者,在标准和CoT提示之间处于中间位置。

为什么CoD比CoT更好?

  • 相同的准确性,较少的标记:CoD几乎达到了与CoT相同的准确性,但使用的标记少得多,使其计算成本更低、速度更快。
  • 更高的效率:减少标记数量意味着更快的响应时间和更低的实时应用成本。
  • 两者兼得:与标准提示相比,后者为了简洁牺牲了准确性,而CoT则过于冗长,CoD找到了平衡点——简洁且准确。

CoD相对于CoT的优势:

  • 更快的推理:由于减少了标记使用,CoD生成响应更快。
  • 更低的计算成本:使用更少的标记意味着更低的操作费用。
  • 更简洁的输出:适用于实时应用,其中简洁性至关重要。
  • 更容易集成到生产系统中:较不冗长的推理使响应更易于用户理解。

CoD相对于CoT的劣势:

  • 透明度较低:CoT提供了清晰的逐步骤分解,这对于调试和解释推理非常有用。
  • 复杂推理时错误风险更高:某些问题需要详细的中间步骤以确保逻辑正确性,这可能是CoD会跳过的。
  • 不适合教育目的:当学习新概念时,详细的解释(如CoT)可能更有益。

3、CoD最适合的应用场景

  • 实时AI应用——客户支持、个人助手和聊天机器人。
  • 资源受限环境——在边缘设备或有限计算资源上运行LLMs。
  • 总结任务——快速提炼文本繁重来源的关键点。
  • 成本优先

最后一点……

4、为什么叫草稿链?

名称 草稿链(CoD)来自这样的想法:与链式思维(CoT)不同,后者详细阐述每个推理步骤,模型生成的是简洁的“草稿”推理步骤——只需保持逻辑完整而无需不必要的冗长。

可以将其想象成写一个粗略的草稿而不是完整的论文。与仔细拼写出每一个思考过程不同,CoD采取极简主义方法,将推理简化为最核心的部分。这使得响应更快、更高效、更经济,同时仍保持准确性。

“链”这一方面仍然适用,因为存在逻辑上的推理进展,只是表达方式更加精简。

5、结束语

链式草稿是一个简单但强大的调整,提高了LLM的效率而不妥协准确性。如果你想要更快、更便宜且同样准确的响应,CoD就是你的选择。


原文链接:What is Chain of Drafts? Bye Bye Chain of Thoughts

汇智网翻译整理,转载请标明出处