메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
이유빈 (군산대학교) 이성준 (군산대학교) 온병원 (군산대학교)
저널정보
한국정보기술학회 Proceedings of KIIT Conference 한국정보기술학회 2021년도 하계종합학술대회 및 대학생논문경진대회
발행연도
2021.6
수록면
431 - 434 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
강화학습은 특정 환경 안에서 에이전트가 앞으로 누적될 보상을 최대화할 수 있도록 일련의 행동으로 정의되는 정책을 찾는 방법이다. 필수 구성 요소는 환경, 상태, 에이전트, 행동, 보상으로 정의된다. 본 논문은 Pendulum 게임 환경에서 Q-learning과 SARSA 2가지의 강화학습 알고리즘을 적용하여 성능 비교 및 분석을 진행한다. 실험 환경은 OpenAI Gym을 이용하여 구축하였다. 실험을 통해 Off-Policy 방식의 Q-learning이 On-Policy 방식의 SARSA 보다 높은 보상 값을 가지며 게임을 안정적으로 유지하는 것을 확인할 수 있었다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 결론
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2021-004-001753504