메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
김성현 (서경대학교) 조영완 (서경대학교)
저널정보
한국지능시스템학회 한국지능시스템학회 논문지 한국지능시스템학회 논문지 제30권 제1호
발행연도
2020.2
수록면
40 - 46 (7page)
DOI
10.5391/JKIIS.2020.30.1.40

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문에서는 정책과 가치가 단일 신경망에 의해 표현되고 학습되는 구조의 신경망을 기반으로 하여 몬테카를로 트리탐색을 적용한 인공지능 오델로 게임 에이전트의 구현을 제안하였다. 본 논문에서 적용하는 신경망 학습은 인공지능플레이어의 자가 대국을 통해 생성된 학습 데이터를 이용하여 수행되는데 기존의 정책이 MCTS를 통해 얻은 강력한 정책을 따라가도록 CNN을 학습한다. 본 논문에서 제안한 인공지능 오델로의 성능 평가를 위해 MPC 탐색을 사용하는 현존 최강 오델로 프로그램인 Wzebra 및 Tothello와 대국을 통해 성능을 비교하였고, 최소최대탐색 알고리즘이 적용된 기존의 에이전트와 본 논문에서 제안하는 에이전트의 신경망 학습 진행에 따른 중간 단계별 에이전트와의 대국을 통해 학습 진행에 따른 승률 변화를 관찰하였다.

목차

요약
Abstract
1. 서론
2. 오델로 게임 에이전트의 강화학습
3. 실험 및 결과
4. 결론
References

참고문헌 (13)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2020-003-000428856