메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

우정훈 (한국항공대학교, 韓國航空大學校)

지도교수
李在桓
발행연도
2020
저작권
한국항공대학교 논문은 저작권에 의해 보호받습니다.

이용수8

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
본 논문에서는 Many Core CPU와 Python 환경에서 Parallel 및 Distributed Deep Learning의 MPI 통신 성능 개선을 위해, 고성능 메모리 모드와 프로세서의 위치가 통신 성능에 미치는 영향에 대해 분석한다. Intel Xeon Phi Knights Landing 프로세서의 On-Package 메모리인 Multi-Channel DRAM(MCDRAM)을 이용하여 Python MPI 통신 성능을 향상시키기 위한 방안을 제안한다. 고 대역폭 MCDRAM을 사용하기 위해 Memkind 라이브러리를 활용하고 Python 환경에서 Memkind 라이브러리를 이용하기 위한 Cython Wrapping을 구현한다. Parallel 및 Distributed Deep Learning에서 데이터를 교환할 때 사용하는 Collective Communication 방법들을 기반으로 MCDRAM과 DDR4의 비교 분석을 하고 Many Core CPU의 Cluster 모드와 Memory 모드에 따라 실험을 수행한다. 또한, Docker의 가상 환경에서 분산 통신에 대한 실험을 수행한다. 실험 검증 결과 제안된 설계에서는 Flat Mode에서 MCDRAM을 사용할 경우, Flat Mode에서 DDR4를 사용한 경우보다 최대 193% 성능 향상을 보였으며 Cache Mode에서 DDR4와 비교했을 때 최대 137% 향상 시킬 수 있음을 보였다.

목차

제 1 장 서론 1
제 2 장 연구 배경 4
2.1 Parallel and Distributed Deep Learning 4
2.2 Python GIL 6
2.3 Many Core CPU : Knights Landing 9
2.4 MCDRAM 11
2.5 Cluster Mode 15
제 3 장 제안하는 설계 및 구현 방안 19
3.1 MPI 19
3.2 MCDRAM 사용을 위한 Memkind 라이브러리 24
3.3 Wrapping Memkind for Python 27
제 4 장 성능 검증을 위한 실험 및 결과 분석 30
4.1 BroadCast 34
4.2 Gather 41
4.3 AllReduce 48
4.4 Cluster Mode 55
제 5 장 관련 연구 58
제 6 장 결론 및 향후 연구 60
참고 문헌 62
SUMMARY 65

최근 본 자료

전체보기

댓글(0)

0