csdn推荐
大模型ReAct:思考与工具协同完成复杂任务推理
夏栀的博客
06-25
852
人类的认知通常具备一定的自我调节(self-regulation)和策略制定(strategization)的能力,对于解决一个复杂问题时,可以很自然地运用工作记忆(working memory)将任务相关的决策动作(actions)与思考推理(reasoning)相结合。虽然现如今诸如Chain-of-Thought(CoT)通过上下文提示的形式可以提高大语言模型step-by-step的推理能力,但是其依然属于静态的黑盒子,依靠其推理的结果。回顾一下Act-only的定义(类似强化学习中的过程),第。
文章来源:https://blog.csdn.net/xuelian3015/article/details/139823816
微信扫描下方的二维码阅读本文
© 版权声明
THE END
暂无评论内容