'NLP/Reinforce learning' 카테고리의 글 목록

[Paper Review] Reflexion : Language Agents with Verbal Reinforcement Learning

NeurIPS 2023 [paper]Noah et al.10 Oct 2023 Introduction본 논문에서는 가중치를 업데이트하지 않고 '언어적'인 피드백을 통해 언어 에이전트를 강화하는 Reflexion 프레임워크를 제안하였다. 구체적으로, Reflexion 에이전트는 task feedback 신호를 언어적으로 반영한 다음, 에피소드를 저장하는 메모리 버퍼에 자기성찰을 위한 피드백 텍스트를 저장함으로써, 이후 시도에서 더 나은 decision-making을 할 수 있도록 유도한다. 자기성찰 피드백을 생성하는 것은 모델의 실수를 이해할 수 있고 이를 개선할 수 있는 통찰력을 제공해줄 수 있다. 그렇다면 자기성찰 피드백은 어떻게 생성할까? 저자들은 이를 해결하기 위해 세 가지 방법으로 1) 간단한 이진..

NLP/Reinforce learning 2024.06.15

부곡감자

NLP/Reinforce learning 1

티스토리툴바