《论文阅读》传统CoT方法和提出的CoT Prompting的区分-EW帮帮网

论文：Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

作者对传统CoT方法和本文提出的CoT Prompting的区分。

实现方式：需人工标注大量〈输入，推理链，输出〉三元组，然后微调模型

# 训练数据示例（需人工编写）
{
  "input": "小明有5个苹果，吃了2个，还剩几个？",
  "rationale": "初始5个 - 吃掉2个 = 剩余3个",  # 人工撰写成本高
  "output": "3"
}

典型结构（Brown et al., 2020）：

输入: "3个苹果每个2元，总价多少？"  
输出: "6元"

输入: "火车2小时行驶240公里，时速多少？"  
输出: "120公里/小时"

输入: "问题..."  # 测试样本

通过提示工程而非微调，直接激发模型的推理能力：

输入: "小明有5个苹果，吃了2个，还剩几个？"
思考: 初始5个 - 吃掉2个 = 剩余3个  
输出: "3"

输入: "一个书包原价80元打7折，现价多少？"
思考: 80元 × 0.7 = 56元  
输出: "56元"

输入: "问题..."  # 测试样本

GSM8K数学题测试：

标准Prompting：

输入: "农场有15只鸡和8头牛，共有多少条腿？"  
输出: "46"  # 错误（未展示计算过程）

CoT Prompting：

输入: "农场有15只鸡和8头牛，共有多少条腿？"  
思考: 鸡腿=15×2=30，牛腿=8×4=32，总腿数=30+32=62  
输出: "62"  # 正确

结果：准确率从17% → 56%（540B参数模型）

作者并非发明CoT概念，而是发现了：

这种方法的革命性在于：将推理能力从模型训练阶段解耦，转变为提示工程问题，使单个预训练模型能零样本处理复杂推理任务。

《论文阅读》传统CoT方法和提出的CoT Prompting的区分