📝 字数：working on

Day91¶

Estimated time to read: 1 minute

13/05/2026

如何维持专注¶

内心希望去看一些信息是难以避免的，这是DMN自发行为；

前额叶可以发起不去执行的控制（评估这个行为是否带来更长期价值），前额叶是一个估值系统，而非开关系统；

但是这个控制需要基于一定的奖励，才可以让其更容易实现；

但是奖励这个概念不是一种补偿，而是对于未来预测的概率提升，让大脑模型更容易选择这个方向，而不是对过往行为的补偿。

这个奖励让下次不去执行随机欲望更容易实现，而不是对这一次没实现的补偿。以避免奖励劫持（reward hacking）：让这个奖励本身称为目标。

奖励要绑定在完成原有目标，而非临时欲望的抑制，当评估返回子任务更好而给予奖励，给的是继续坚持了原有目标、进一步实现了原有目标。因此要在原有目标路径上增设奖励行为，以维持原路径的持续运行，就像过关游戏一样。

获取更多信息是~~低成本高奖励行为~~，身体本身需要的是奖励，而不是信息，因为你无法懂得自己没有经历过的事情，那些信息并没有对自己的真实价值。

专注的本质

让任务本身的奖励 > 外部信息奖励