提示工程:从思维链到草稿链
草稿链(Chain of Draft)是一种旨在简化推理而不牺牲准确性的提示技术。可以将其视为更详细的思维链(CoT)方法的“言简意赅”版本。

几个月来,思维链(CoT)一直是任何使用LLM或ChatGPT的人的首选提示技术。我一直发现CoT的一个问题是其冗长。
它生成了太多的标记。
你问ChatGPT一个简单的问题,却得到一篇论文作为回答吗?这就是 草稿链(CoD)的作用——一种旨在简化推理而不牺牲准确性的提示技术。可以将其视为更详细的思维链(CoT)方法的“言简意赅”版本。让我们分解一下!
1、什么是草稿链(CoD)?
CoD是一种优先考虑简洁推理步骤的提示方法,以提高效率。与CoT不同,后者详细地走完每一步,CoD专注于仅提供解决问题所需的关键信息。这意味着:
- 减少冗长——没有过多的解释。
- 减少标记数——降低计算成本。
- 更快的响应——适用于实时应用的理想选择。
简单示例

让我们使用一个基本的数学问题来比较不同的提示技术:
问题: 杰森有20个棒棒糖。他给了丹尼一些。现在他还剩下12个。杰森给了丹尼多少个棒棒糖?
标准提示(直接答案)
- 回复: 8
思维链(CoT)提示(逐步解释)
- 回复:
杰森一开始有20个棒棒糖。
给了一些之后,他剩下12个。
要找出他给了多少,我们做减法:20 - 12。
这给出了8。
草稿链(CoD)提示(简洁推理)
- 回复: 20 - 12 = 8 → 最终答案:8.
看到区别了吗?CoT是全面的,但可能过于繁琐。CoD去除了不必要的部分,保留清晰度的同时节省时间。
2、指标和基准


如您所见,CoD似乎是现实问题的解决者,在标准和CoT提示之间处于中间位置。
为什么CoD比CoT更好?
- 相同的准确性,较少的标记:CoD几乎达到了与CoT相同的准确性,但使用的标记少得多,使其计算成本更低、速度更快。
- 更高的效率:减少标记数量意味着更快的响应时间和更低的实时应用成本。
- 两者兼得:与标准提示相比,后者为了简洁牺牲了准确性,而CoT则过于冗长,CoD找到了平衡点——简洁且准确。
CoD相对于CoT的优势:
- 更快的推理:由于减少了标记使用,CoD生成响应更快。
- 更低的计算成本:使用更少的标记意味着更低的操作费用。
- 更简洁的输出:适用于实时应用,其中简洁性至关重要。
- 更容易集成到生产系统中:较不冗长的推理使响应更易于用户理解。
CoD相对于CoT的劣势:
- 透明度较低:CoT提供了清晰的逐步骤分解,这对于调试和解释推理非常有用。
- 复杂推理时错误风险更高:某些问题需要详细的中间步骤以确保逻辑正确性,这可能是CoD会跳过的。
- 不适合教育目的:当学习新概念时,详细的解释(如CoT)可能更有益。
3、CoD最适合的应用场景
- 实时AI应用——客户支持、个人助手和聊天机器人。
- 资源受限环境——在边缘设备或有限计算资源上运行LLMs。
- 总结任务——快速提炼文本繁重来源的关键点。
- 成本优先
最后一点……
4、为什么叫草稿链?
名称 草稿链(CoD)来自这样的想法:与链式思维(CoT)不同,后者详细阐述每个推理步骤,模型生成的是简洁的“草稿”推理步骤——只需保持逻辑完整而无需不必要的冗长。
可以将其想象成写一个粗略的草稿而不是完整的论文。与仔细拼写出每一个思考过程不同,CoD采取极简主义方法,将推理简化为最核心的部分。这使得响应更快、更高效、更经济,同时仍保持准确性。
“链”这一方面仍然适用,因为存在逻辑上的推理进展,只是表达方式更加精简。
5、结束语
链式草稿是一个简单但强大的调整,提高了LLM的效率而不妥协准确性。如果你想要更快、更便宜且同样准确的响应,CoD就是你的选择。
原文链接:What is Chain of Drafts? Bye Bye Chain of Thoughts
汇智网翻译整理,转载请标明出处
