AI 为什么老是半路下班?我用一个 UFO 游戏做了次无人值守任务测试

AI 为什么老是半路下班?我用一个 UFO 游戏做了次无人值守任务测试

5 分钟
分类:AI实验纪实
标签:#AI Agent#提示词工程#无人值守任务#AI编程
🧪
我用一个飞碟吸小兵网页游戏,测试 AI 能不能像员工一样按目标、边界、验收单持续推进,并整理出可复用提示词模板。
 
AI 最像职场新人的地方,不是犯错,而是它特别喜欢半路下班。你让它改一个项目,它改两行代码,写一段总结,然后非常礼貌地告诉你:我已经完成了。
notion image
这期我做了一个小实验:让 AI 从一个模糊童年记忆出发,做一个“飞碟吸小兵”的网页小游戏。区别是,我不再一句一句催它,而是像管理一个员工一样,给它目标、边界、验收单、复盘要求和停机条件。
 
notion image

核心结论

  • AI 提前收工,通常不是因为它懒,而是因为你没有定义“完成”的证据。
  • 无人值守不是让 AI 更亢奋,而是让任务内部自带一个挑刺的评审者。
  • 好的提示词不是一句命令,而是一张目标工单:目标、规则、验收、边界、复盘、停机条件都要写清楚。
notion image

可复用提示词模板

你现在不是聊天助手,而是一个可以持续推进任务的执行代理。 【目标】 我要你完成:{任务名称} 最终交付物是:{交付物} 使用场景是:{使用者/平台/运行环境} 【背景】 已知信息: - {背景1} - {背景2} - {素材/路径/约束} 【规则】 你必须遵守: 1. 先做最小可用版本,再逐步增强。 2. 每一步都要产生可检查的证据。 3. 不要因为完成了一部分就总结收工。 4. 遇到权限、依赖、路径、登录态问题时,先尝试可验证的替代方案;仍无法推进时再报告。 【完成标准】 只有同时满足以下条件,才算完成: - {验收项1:功能/质量/格式} - {验收项2:运行/截图/测试结果} - {验收项3:用户可直接使用} 【边界】 不要做: - {不要扩展的方向} - {不要引入的复杂度} - {不要改动的文件/数据/账号设置} 【自我评审】 每轮完成后,你要扮演评审者,检查: - 目标是否真的完成? - 有没有证据? - 有没有违反边界? - 用户是否还需要额外手动补步骤? 【停机条件】 只有在完成标准全部通过后,才允许输出最终总结。 如果未通过,继续迭代,不要把“已完成部分”当成最终交付。

UFO 游戏版示例

目标:做一个 2D 像素风 UFO 指挥小游戏。 玩法:玩家控制飞碟吸走敌方小兵,再释放我方小兵攻击基地。 交付:一个可直接运行的网页小游戏,包含 HTML/CSS/JS。 验收: - 页面能在本地浏览器打开。 - UFO 能移动、吸兵、释放兵。 - 双方基地有血量,小兵能自动锁敌攻击。 - 至少能出现胜利或失败状态。 - 截图或自动化测试能证明游戏真的跑起来。 边界: - 不做复杂联网、账号、后端。 - 不追求完整商业游戏,只做可玩原型。 停机: - 没通过验收就继续修,不要提前总结完成。

怎么改成任何项目

把“UFO 游戏”替换成你的真实任务,把“能移动、能吸兵、能胜负”替换成你的验收证据。写文章就验收标题、结构、事实来源和发布草稿;写代码就验收运行、测试、截图和边界;做视频就验收成片、封面、字幕、平台状态。
一句话总结:别只给 AI 一个愿望,给它一张能自我验收的工单。
分享到:

相关文章

返回首页