순환 신경망 기반 심층 강화 학습: DRQN을 이용한 부분 관측 환경 해결
부분 관측 문제를 극복하는 DRQN 아키텍처
심층 강화 학습 분야에서, 전통적인 DQN(Deep Q-Network)은 완전한 상태 정보를 가정하기 때문에 현실 세계의 많은 상황에 적용하기 어렵다. 예를 들어 자율주행 차량이 센서의 시야 제한으로 인해 전체 도로 상황을 파악하지 못하거나, 로봇이 장애물에 의해 일부 영역을 관측할 수 없는 경우가 있다. 이러한 부분 관측 마르코프 ...
6월 7일 19:54에 게시됨