지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수38
I. 서 론 1II. 지도학습 32-1. 학습 데이터 구성 42-1-1. 입력 특징 추출 52-1-2. 네트워크 출력 102-2. 네트워크의 구성 12III. 의사결정 과정 153-1. 최소최대탐색 153-2. 알파-베타 가지치기(Alpha-Beta Pruning) 173-3. 게임에이전트의 의사결정 과정 19IV. 강화학습 224-1. 강화학습 문제의 정의 224-2. 가치함수와 정책 234-3. 정책 iteration 244-4. 제안하는 강화학습 방법 25V. 실험 및 결과 분석 315-1. 실험환경 315-2. 오델로 인공지능 에이전트의 성능 평가 325-2-1. 지도학습 네트워크 평가 325-2-2. 강화학습 네트워크 평가 39VI. 결론 41참 고 문 헌 43
0