메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

정상현 (연세대학교, 연세대학교 대학원)

지도교수
김우주
발행연도
2021
저작권
연세대학교 논문은 저작권에 의해 보호받습니다.

이용수29

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
Beer Game과 같은 부분관찰환경 공급사슬망에서는 공장, 물류창고, 도매상, 소매상 에이전트들이 서로의 재고 수준, 배송량 등의 상태 정보를 알지 못한 채 주문량을 결정해야 한다. 이러한 환경에서는 전통적인 재고관리 기법인 기준재고정책을 따르는 것이 일반적이나, 복수의 에이전트가 존재하는 다단계 공급사슬망 또는 계절적 수요 패턴이 존재하는 경우 등에서는 최적 기준재고수준을 구하는 데 어려움이 따른다.
본 연구는 Beer Game의 모든 에이전트를 심층강화학습 기법인 DQN 알고리즘으로 구현하여 기준재고정책을 대체할 수 있는 방법을 제안한다. 이러한 멀티 DQN 에이전트로 공급사슬망 전체의 비용을 최소화하기 위해서는 에이전트들이 서로 협력할 수 있는 방법을 학습해야 한다. 따라서 본 연구는 두 가지의 새로운 협력 피드백 방법을 제안함으로써 이를 해결하고자 하는데, 하나는 협력 피드백 조정 계수를 초매개변수로 활용하는 정적 피드백 방법이고, 다른 하나는 DQN의 신경망으로 협력 정도를 학습하는 동적 피드백 방법이다. 실험 결과, 멀티 DQN 에이전트는 상호 간 협력을 통해 기준재고정책보다 공급사슬망의 비용을 낮출 수 있었다.

목차

등록된 정보가 없습니다.

최근 본 자료

전체보기

댓글(0)

0