지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수7
제1장 서론 1제1절 연구 배경 및 목적 1제2절 논문 구성 3제2장 관련 연구 4제1절 분류 시스템 41. 연구 동향 4제2절 강화 학습 61. Deep Q-Network 62. 다중 에이전트 강화 학습 6제3장 강화 학습 설계 8제1절 환경 기술 및 특성 81. 시나리오 82. 문제 정의 93. 충돌 10제2절 State 정의 12제3절 Action 정의 21제4절 Reward 정의 27제4장 심층 강화 학습 알고리즘 29제1절 다중 에이전트 29제2절 모델 구조 32제3절 알고리즘 38제5장 실험 39제1절 레이아웃 39제2절 성능 평가 461. 평가 지표 462. 학습 그래프 473. Loss 그래프 514. 일반화 55제3절 성능 비교 561. GridSorter 562. 알고리즘 573. 비교 결과 58제6장 결론 59제1절 정리 59참고문헌 60Abstract 65
0