지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수22
1. 서론 12. 배경 연구 32.1. 강화학습 적용 사례 32.1.1. 아타리 벽돌깨기 32.1.2. 블레이드앤소울 32.1.3. 쿠키런 42.1.4. 캔디 크러시 사가 52.2. 매치 3 게임 62.2.1. 주요 요소 62.2.1.1. 임무 92.2.1.2. 장애물 12.2.1.3. 특수 블록 102.2.1.4. 특수 블록 합체 112.3. Monte Carlo Tree Search 122.4. 강화 학습(Reinforcement Learning) 142.4.1. Q-Learning 142.4.2. Proximal Policy Optimization 152.5. 유니티 ML SDK 173. 설계 및 구현 203.1. 매치 3 게임 구현 203.2. 블록 구현 233.2.1. 일반 블록 253.2.2. 특수 블록 263.2.2.1. Four Match Block 263.2.2.2. LT Match Block 273.2.2.3. Five Match Block 283.2.3. 장애물 블록 293.3. ML 에이전트 구성 303.3.1. 관측 정보 정의 303.3.2. 행동 정보 정의 324. 실험 및 결과 344.1. 학습 환경 344.1.1. 스테이지 구성 344.1.2. 보상 설정 354.1.3. 비헤이비어 파라미터 364.1.4. 하이퍼파라미터 374.2. 비교 데이터 설정 384.3. 결과 분석 395. 결론 425.1. 연구의 결론 425.2. 연구의 한계점 435.3. 향후 연구 과제 43
0