메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
정근우 (고려대학교) 민대홍 (고려대학교) 박주영 (고려대학교)
저널정보
한국지능시스템학회 한국지능시스템학회 학술발표 논문집 한국지능시스템학회 20주년 기념 2010년도 추계학술대회 학술발표논문집 제20권 제2호
발행연도
2010.11
수록면
35 - 38 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 들어 강화학습(reinforcement leaning)은 계산 지능(computational intelligence) 분야에서 주요한 도구로 자리잡아 가고 있다. 현재 강화학습 기법은 가치함수 기반 기법(value-function-based methods), 액터-크리틱 기법(actor-critic methods) 및 정책 탐색 기법(policy search methods) 등의 방향으로 계속적인 발전을 이루어 가고 있으며, 특히 최근에 발표된 새로운 강화학습 기법들은 로봇학습을 비롯한 각종 공학 문제에 성공적으로 적용되는 모습을 보여주고 있다. 본 논문에서는 최근에 소개된 강화학습 방법론들 중 공학적 활용성이 뛰어난 것으로 판단되는 주요기법들을 간단히 소개하고, 시뮬레이션을 통하여 이들이 갖는 성능을 비교·평가해보는 작업을 수행하였다. 이러한 비교·평가 작업에서는 RWR(reward-weighted regression) 기법과 NAC(natural actor-critic) 기법이 고려되었으며, 성능평가를 위한 시뮬레이션 대상으로는 도립진자 문제가 활용되었다.

목차

요약
1. 서론
2. 최신 주요 강화학습 기법 소개
3. 도립진자 문제를 이용한 학습방법론 성능평가
4. 결론 및 향후 연구 과제
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2012-028-003989465