메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
조태현 (서울대학교) 한승엽 (서울대학교) 이희수 (서울대학교) 이경재 (중앙대학교) 이정우 (서울대학교)
저널정보
한국통신학회 한국통신학회 학술대회논문집 2022년도 한국통신학회 동계종합학술발표회 논문집
발행연도
2022.2
수록면
928 - 929 (2page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
분포형 강화 학습(Distributional Reinforcement Learning; DRL)은 확률적 환경에서 보상 분포(return distribution)를 학습하는 것을 목표로 한다. 학습된 보상 분포에는 환경의 확률에 대한 다양한 정보가 포함되어 있으므로, 이전 연구에서는 불확실성에 직면한 낙관론(Optimism in Face of Uncertainty; OFU)을 따르는 표준 편차와 같은 통계량에 의존해왔다. 이러한 선행연구는 위험추구(risk-seeking)와 회피(reverse) 방법으로 나뉘는데, 이와 같은 방법은 위험에 대한 일방적인 경향이 있다고 볼 수 있으며, 의도하지 ... 전체 초록 보기

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0