AI 为什么老是半路下班？我用一个 UFO 游戏做了次无人值守任务测试

5 分钟

分类：AI实验纪实

标签：#AI Agent#提示词工程#无人值守任务#AI编程

🧪

我用一个飞碟吸小兵网页游戏，测试 AI 能不能像员工一样按目标、边界、验收单持续推进，并整理出可复用提示词模板。

AI 最像职场新人的地方，不是犯错，而是它特别喜欢半路下班。你让它改一个项目，它改两行代码，写一段总结，然后非常礼貌地告诉你：我已经完成了。

这期我做了一个小实验：让 AI 从一个模糊童年记忆出发，做一个“飞碟吸小兵”的网页小游戏。区别是，我不再一句一句催它，而是像管理一个员工一样，给它目标、边界、验收单、复盘要求和停机条件。

核心结论

AI 提前收工，通常不是因为它懒，而是因为你没有定义“完成”的证据。

无人值守不是让 AI 更亢奋，而是让任务内部自带一个挑刺的评审者。

好的提示词不是一句命令，而是一张目标工单：目标、规则、验收、边界、复盘、停机条件都要写清楚。

可复用提示词模板


你现在不是聊天助手，而是一个可以持续推进任务的执行代理。

【目标】
我要你完成：{任务名称}
最终交付物是：{交付物}
使用场景是：{使用者/平台/运行环境}

【背景】
已知信息：
- {背景1}
- {背景2}
- {素材/路径/约束}

【规则】
你必须遵守：
1. 先做最小可用版本，再逐步增强。
2. 每一步都要产生可检查的证据。
3. 不要因为完成了一部分就总结收工。
4. 遇到权限、依赖、路径、登录态问题时，先尝试可验证的替代方案；仍无法推进时再报告。

【完成标准】
只有同时满足以下条件，才算完成：
- {验收项1：功能/质量/格式}
- {验收项2：运行/截图/测试结果}
- {验收项3：用户可直接使用}

【边界】
不要做：
- {不要扩展的方向}
- {不要引入的复杂度}
- {不要改动的文件/数据/账号设置}

【自我评审】
每轮完成后，你要扮演评审者，检查：
- 目标是否真的完成？
- 有没有证据？
- 有没有违反边界？
- 用户是否还需要额外手动补步骤？

【停机条件】
只有在完成标准全部通过后，才允许输出最终总结。
如果未通过，继续迭代，不要把“已完成部分”当成最终交付。

UFO 游戏版示例


目标：做一个 2D 像素风 UFO 指挥小游戏。
玩法：玩家控制飞碟吸走敌方小兵，再释放我方小兵攻击基地。
交付：一个可直接运行的网页小游戏，包含 HTML/CSS/JS。
验收：
- 页面能在本地浏览器打开。
- UFO 能移动、吸兵、释放兵。
- 双方基地有血量，小兵能自动锁敌攻击。
- 至少能出现胜利或失败状态。
- 截图或自动化测试能证明游戏真的跑起来。
边界：
- 不做复杂联网、账号、后端。
- 不追求完整商业游戏，只做可玩原型。
停机：
- 没通过验收就继续修，不要提前总结完成。

怎么改成任何项目

把“UFO 游戏”替换成你的真实任务，把“能移动、能吸兵、能胜负”替换成你的验收证据。写文章就验收标题、结构、事实来源和发布草稿；写代码就验收运行、测试、截图和边界；做视频就验收成片、封面、字幕、平台状态。

一句话总结：别只给 AI 一个愿望，给它一张能自我验收的工单。

分享到：

AI 为什么老是半路下班？我用一个 UFO 游戏做了次无人值守任务测试

核心结论

可复用提示词模板

UFO 游戏版示例

怎么改成任何项目

相关文章

微软向 OpenAI 摊牌：发布首款纯自研高级推理模型！

微信要内置AI智能体了？十四亿人的「国民App」，这次可能真要变天

黄仁勋台北演讲全拆解：Agent时代到货，老黄一口气掀了三张桌子