写好 Prompt 的 12 条实践经验-EW帮帮网

大模型的能力越来越强，但想让它们真正为我们所用，Prompt 的设计依然是关键。很多人一开始写 Prompt 会觉得“玄学”，效果时好时坏。其实在长期实践中，是有一些规律可循的。本文结合我在不同任务和模型上的实际经验，整理了 12 条写 Prompt 的心得，希望对你有所帮助。

不同模型各有所长
- 一个复杂任务，未必一个模型就能搞定。
- 示例：大纲生成 → Claude 效果最佳；超长文阅读理解 → Kimi 表现更好。
单任务多模型协同
- 用不同模型取长补短，往往能解决单个模型卡住的问题。
- 示例：GPT 写代码失败 → Claude 写一版 → 再交给 GPT 改 → 最终完成任务。
模型能力的边界
- 如果 Prompt 调整无效，很可能不是写法的问题，而是模型本身能力不足。
- 建议：多尝试不同模型，先验证可行性。

如果任务是让 LLM 做评测：
- 推荐用 GPT-4o，因为它的判断更接近人工标准。
- 能力较弱的模型在复杂任务上评分偏差大。
- 在综述写作评测中，我们明显看到 GPT-4o 的结果比其他模型更可靠。

写好 Prompt 并不是玄学，而是技巧与经验的积累。

最终目标，不是追求一条“完美 Prompt”，而是找到一个“稳定、可复现的流程”，让模型更高效地为我们服务。

要不要我帮你把这篇博客写得更“故事化”，比如加一些失败案例和对比实验？这样读者会觉得更有代入感。

写好 Prompt 的 12 条实践经验