메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

지승현 (고려대학교, 高麗大學校 大學院)

지도교수
朴柱榮
발행연도
2016
저작권
고려대학교 논문은 저작권에 의해 보호받습니다.

이용수1

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
최근 기계학습(machine learning)에서 강화학습(reinforcement learning)과 근사적 추론(approximate inference) 기법은 확률론적 최적 제어(stochastic optimal control) 문제의 해법으로 중요한 도구가 되고 있다. 특히 강화학습과 근사적 추론기법을 융합한 근사적 추론 기반 강화학습(approximate inference reinforcement learning)을 확률론적 최적 제어 문제의 전략으로 사용한다면 여러 가지 측면에서 유용한 성질을 갖는다. 이와 같은 융합 연구로 가치함수(value function) 기반 동적 계획법(dynamic programming)을 들 수 있다. 하지만 이러한 전략은 매우 간단한 공학적 문제에만 적용된다는 한계를 갖고 있다. 그러므로, 엄격한 수학적 분석 대신 기대 비용을 최소화하는 방향으로 상태 전이 및 보상 데이터를 활용하여 준최적해를 구하는 방법이 있으며 이는 효과적이라 판단되고 있다. 본 논문에서는 이러한 데이터 기반 확률론적 최적 제어 전략을 사용하며 근사적 추론 기반 강화학습 접근 방법의 융합을 고려한다. 그리고 제안한 방법론의 간단한 일차원 제어 문제에 적용하는 실험을 통해 결과를 고찰한다. 또한, 본 논문에서는 최신 기계학습 방법론 중에서 다양한 문제에 적용되는 커널 기법(kernel methods)의 개선을 고려한다. 최근 기술 발달로 인해 다수의 센서를 활용하는 장비들이 증가하고 있으며, 이러한 환경에서 다중 작업 처리 능력의 중요성이 커지고 있다. 따라서 본 논문에서는 다중 작업 가우시안 프로세스(multi-task Gaussian process, MTGP)를 활용해 다 범주 분류형 데이터(categorical data)의 효율적인 처리를 위한 문제를 고찰한다. 서포트 벡터 머신(support vector machine), 신경망(neural network)의 기존 기계학습 방법론과 본 논문에서 제안한 방법론과의 웨어러블 디바이스로부터 수집되는 신체 활동량 정보 데이터 처리 실험 비교를 통해 본 논문 방법론의 효율성을 살펴본다.

목차

목 차
Abstract ·············································································ⅰ
요 약 ·············································································ⅲ
목 차 ·············································································ⅴ
그림목차 ·············································································ⅶ
표 목차 ·············································································ⅸ
1. 서론 1
2. 기초 이론 3
2.1. 확률론적 최적 제어 3
2.2. 강화학습 4
2.2.1. 마르코프 결정과정 5
2.2.2. 가치함수와 벨만방정식 6
2.3. 커널 기법 7
2.3.1. 가우시안 프로세스 8
2.3.2. 서포트 벡터 머신 11
2.4. 신경망 14
3. 데이터 기반 확률론적 최적 제어 173.1. 정보 이론 확률론적 최적 제어 17
3.2. 피드백 학습 제어기 23
4. 가우시안 프로세스 개선 전략 254.1. 다중 작업 가우시안 프로세스 25
5. 실험 및 결과 29
5.1. 일차원 제어 문제 29
5.2. 다 범주 분류형 데이터 분류 문제 31
5.2.1. 이중 작업 분류 문제 32
5.2.2. 다중 작업 분류 문제 35
6. 결론 및 향후 과제 41
7. 참고 문헌 42
감사의 글

최근 본 자료

전체보기

댓글(0)

0