메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
이재민 (여수문수중학교) 이형옥 (순천대학교)
저널정보
한국컴퓨터교육학회 한국컴퓨터교육학회 학술발표대회논문집 한국컴퓨터교육학회 2023년도 동계 학술발표논문집 제27권 제1호
발행연도
2023.1
수록면
169 - 172 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
딥러닝과 강화학습을 결합한 심층강화학습은 바둑, 게임 등 다양한 분야의 어려운 문제를 해결하면서 실생활의 문제까지 해결할 가능성이 높아 다양한 연구들이 이루어지고 있다. 본 논문은 수학적 필승전략이 존재하는 조합게임 중 하나인 님게임에서 강화학습의 알고리즘을 이용하여 필승전략을 찾는 방법을 제안한다. 가치 기반 강화학습의 대표적인 Deep Q-network 알고리즘과 정책 경사 기반 강화학습의 대표적인 Proximal Policy Optimization 알고리즘을 이용하여 무작위 행동 에이전트와 필승전략을 아는 에이전트와의 환경과 상호작용을 통해 두 알고리즘을 비교분석하였다. 필승전략은 각 알고리즘에서 행동을 선택하는 네트워크 값을 그래프로 표현하고 님게임의 필승전략과 비교하였다. 개수가 20개 이하는 모두 학습이 잘 되었고 DQN 알고리즘보다 PPO 알고리즘이 필승전략을 빨리 찾았다. 그러나 개수가 큰 경우는 찾지 못하고 필승전략을 찾지 못하고 31개인 경우는 DQN 에이전트와 필승전략 에이전트의 대결 결과에서만 필승전략을 구할 수 있었다.

목차

요약
1. 서론
2. 연구 배경
3. 연구 내용 및 방법
4. 연구 결과 및 분석
5. 결론 및 제언
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2023-037-000381889