메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

고동현 (인하대학교, 인하대학교 대학원)

지도교수
최기영
발행연도
2020
저작권
인하대학교 논문은 저작권에 의해 보호받습니다.

이용수37

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
무인 항공기의 중요성이 커짐에 따라 무인 항공기를 활용한 공중 교전을 위해 기본 전술 기동 활용, 상황인지 아키텍처 적용 등과 같은 다양한 방법에 대한 연구가 수행되고 있다. 인공지능은 입력과 출력의 관계가 명확하게 정의되지 않는 문제에 적합한 것으로 알려져 있으며 이러한 인공지능의 특징은 무인 항공기를 활용한 공중 교전의 문제의 특징과 유사하다고 할 수 있다. 따라서 무인 항공기를 활용한 공중 교전은 인공지능을 활용하기에 적합한 분야라고 할 수 있다.
본 논문에서는 강화학습을 활용하여 무인 항공기의 공중 교전을 위한 전술 기동 알고리즘을 개발하였다. 개발에 활용한 강화학습 기법은 Deep-Q-Network로서 기존의 Q-러닝 기법에 인공 신경망을 결합한 방법이다. 제안하는 알고리즘은 2중 구조로 구성되어 있으며 각각의 알고리즘은 Deep-Q-Network로 구성하였다. 외부 학습 모델의 역할은 현재 아군 항공기와 적군 항공기의 상태정보를 바탕으로 무인 항공기의 모드를 선택하는 역할을 수행한다. 내부 학습 모델의 역할은 공중 교전에서 유리한 위치로 이동하기 위한 제어 명령을 생성하는 역할을 한다. 내부 제어기를 학습하는 과정에서 학습 속도를 높이기 위해서 공중 교전을 위한 제어 명령을 3축으로 나누었으며 각 축별로 학습 모델을 개발하였다. 개발한 학습 모델은 인공 신경망 결합 방법으로 통합하였다. 그리고 통합한 학습 모델의 성능을 향상시키기 위해 Self-Play 기법을 적용하였으며 이에 따라 알고리즘의 성능이 개선됨을 확인할 수 있었다. 그리고 이렇게 개발한 알고리즘의 타당성을 확인하기 위해 유사한 상황에서 기본 전술 기동과 궤적 비교를 진행하였으며 학습을 수행한 영역에서 기본 전술 기동과 유사한 궤적을 확인할 수 있었다. 외부 학습 모델은 분류 문제로 정의할 수 있지만 강화학습을 활용하여 외부 학습 모델을 구성할 수 있었다. 마지막으로 학습을 통해 숙련도가 높아진 모델 간의 공중 교전에 대한 분석을 통해 학습 모델의 성능과 타당성을 확인하였다.

목차

1. 연구개요 1
1.1. 연구배경 1
1.2. 유사 연구 사례 4
1.2.1. 이론적 접근을 통한 교전 알고리즘 4
1.2.2. 기본 전술 기동을 통한 교전 알고리즘 5
1.2.3. 비선형 제어 기법을 활용한 무인 항공기의 유도 알고리즘 개발 6
1.2.4. 다이나믹 프로그래밍 기법을 활용한 무인 항공기의 공중교전 개발 7
1.2.5. 공중전 모의용 기본 전술기동 기반 조종사 인공지능 모델 8
1.2.6. 기본 전투 기동과 강화 학습 기반 자율 공중 교전 알고리즘 9
1.2.7. 인지아키텍처를 통한 교전 알고리즘 10
1.2.8. 강화학습을 활용 사례 11
1.3. 연구 의의 12
1.4. 논문의 구성 13
2. 항공기 운동 모델 14
2.1. 무인 항공기 운동 모델의 특징 14
2.2. Dynamics Equations 15
2.3. Kinematics Equations 16
2.4. 운동 모델 시뮬레이션 18
3. 강화학습을 활용한 무인 항공기 제어 19
3.1. 강화 학습 19
3.2. Q 러닝 22
3.3. Deep Q Network 23
3.4. Self-Play와 강화학습 24
4. 공중 교전을 위한 DQN 25
4.1. 공중 교전을 위한 알고리즘 정의 25
4.2. 인공 신경망 결합 27
4.3. 알고리즘 학습 과정 33
4.4. 기본 모델 학습 36
4.4.1. 속도 학습 모델 36
4.4.2. 피치 학습 모델 39
4.4.3. 롤 학습 모델 41
4.5. 인공 신경망 결합을 통한 generator 생성 44
4.5.1. 공격 모드 검증 46
4.5.2. 수비 모드 검증 48
4.5.3. 단일 모델 시뮬레이션 50
4.6. Self-Play를 통한 Generator 학습 53
4.6.1. 알고리즘 학습 과정 53
4.6.2. 모델 검증 시나리오 55
4.6.3. 학습 모델 검증 57
4.6.4. 기본전술기동과 비교 61
4.7. 운용 모드 선택 알고리즘(Selector) 82
4.7.1. Selector 구조 82
4.7.2. Selector의 보상함수 84
4.7.3. Selector 검증 88
4.8. Self-Play를 통한 Selector의 추가 학습 94
4.8.1. 알고리즘 학습 과정 94
4.8.2. 학습 모델 검증 96
5. 결론 100
6. 참고문헌 102

최근 본 자료

전체보기

댓글(0)

0