지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수29
1. 서론 12. 이론적 배경 32.1 Imitation Learning 32.2 Behavioral Cloning 42.3 Actor Critic 52.4 Proximal Policy Optimization 63. 알고리즘 설계 및 구현 73.1 Domain Knowledge 회피기동 알고리즘 설계 73.2 지도학습 네트워크 설계 113.3 강화학습 알고리즘 설계 194. 모의실험 및 결과 224.1 강화학습 알고리즘 별 Reward 수렴 결과 비교 254.2 회피 기동 알고리즘 별 회피결과 비교 285. 결론 및 향후 과제 31참 고 문 헌 35
0