Skip to content
📝 字数:working on

Day91

Estimated time to read: 1 minute

13/05/2026

如何维持专注

内心希望去看一些信息是难以避免的,这是DMN自发行为;

前额叶可以发起不去执行的控制(评估这个行为是否带来更长期价值),前额叶是一个估值系统,而非开关系统;

但是这个控制需要基于一定的奖励,才可以让其更容易实现;

但是奖励这个概念不是一种补偿,而是对于未来预测的概率提升,让大脑模型更容易选择这个方向,而不是对过往行为的补偿。

这个奖励让下次不去执行随机欲望更容易实现,而不是对这一次没实现的补偿。以避免奖励劫持(reward hacking):让这个奖励本身称为目标。

奖励要绑定在完成原有目标,而非临时欲望的抑制,当评估返回子任务更好而给予奖励,给的是继续坚持了原有目标、进一步实现了原有目标。因此要在原有目标路径上增设奖励行为,以维持原路径的持续运行,就像过关游戏一样。

获取更多信息是~~低成本高奖励行为~~,身体本身需要的是奖励,而不是信息,因为你无法懂得自己没有经历过的事情,那些信息并没有对自己的真实价值。

专注的本质

让任务本身的奖励 > 外部信息奖励

评论