메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
곽동준 (서울대학교) 김현진 (서울대학교)
저널정보
한국항공우주학회 한국항공우주학회 학술발표회 초록집 한국항공우주학회 2011년도 추계학술대회 및 정기총회
발행연도
2011.11
수록면
252 - 256 (5page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
본 논문에서는 서로 경쟁적인 관계에 있는 추적자와 도망자 사이의 추적-회피 게임을 다룬다. 추적자는 도망자를 최단 시간 내에 잡기 위해 확률맵을 사용하고, 그 확률정보를 이용함에 있어서 기존 추적방식인 global-max 와 local-max 방식의 장점을 취한 hybrid 추적방식을 사용한다. 이 추적방식이 지닌 global-max 와 local-max 성향에 대한 가중치를 최적화 하기 위해 에피소드 개념에 기반한 매개변수 최적화 알고리즘을 사용하였다. 이 최적화 알고리즘은 여러 추적-회피 게임 에피소드가 반복적으로 수행되는 동안 강화학습 기법을 이용하여 가중치 매개변수에 따른 보상을 업데이트 하고 추적자들이 빠른 시간 내에 최대한 많은 수의 도망자를 잡을 때 높은 보상을 기대할 수 있다. 결과적으로 수치 시뮬레이션을 통해 최적의 가중치를 지닌 hybrid 추적방식이 다른 추적방식들 보다 좋은 성능을 보이는 것을 알 수 있다.

목차

초록
ABSTRACT
1. 서론
2. 추적-회피 게임 설정
3. 확률기반 추적-회피 게임
4. 에피소드 매개변수 최적화
5. 강화학습을 통한 최적정책
6. 결론
후기
참고문헌

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0