메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이영하 (숭실대학교, 숭실대학교 대학원)

지도교수
최재영
발행연도
2018
저작권
숭실대학교 논문은 저작권에 의해 보호받습니다.

이용수6

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
BLAS는 선형대수에서 요구하는 기초적인 벡터 및 행렬간의 연산을 빠르게 수행할 수 있도록 구현되어 있는 과학계산용 라이브러리이다. 이 중 Level 3 BLAS는 행렬과 행렬간의 연산을 정의하는데, 이 Level 3 BLAS를 최적화하는데 가장 기초가 되는 함수는 일반 행렬 곱셈 연산인 GEMM 함수이다. 따라서 BLAS의 최적화를 위해 행렬 곱셈을 효과적으로 구현해야 한다.
행렬 곱셈의 최적화 과정은 레지스터 사용개수, 캐시에 적합한 블록크기, 루프 언롤링 횟수, 프리패치 거리 등을 찾아내기 위해 많은 실험을 요구하므로 이를 찾아내기 위해서는 많은 시간과 노력이 소요된다. 오토튜닝 프로그램은 탐색 과정을 컴퓨터가 자동으로 수행하고 최적값을 찾아내도록 한다. 다만 최근에 등장한 Intel 프로세서들은 최신 벡터 명령어로서 AVX-512를 탑재하고 있는데 이를 고려한 오토튜닝 프로그램은 아직 알려져 있지 않다.
본 연구에서는 AVX-512를 지원하는 다양한 인텔 프로세서에서 최적화된 행렬 곱셈을 구성할 수 있는 오토튜닝 방법을 보인다.

목차

국문초록 iv
영문초록 v
제 1 장 서론 1
1.1 연구 배경 1
1.2 연구 목적 및 내용 3
제 2 장 관련 연구 4
2.1 PHiPAC 4
2.2 ATLAS 6
2.3 BLIS 7
2.4 AVX-512 9
제 3 장 연구 내용 10
3.1 시스템 소개 10
3.2 일반 행렬 곱셈 알고리즘 11
3.2.1 마이크로 커널의 구현 12
3.2.2 외부 루프의 구현 18
3.3 오토튜닝 25
3.3.1 오토튜닝 프로그램의 구성 및 진행 25
3.3.2 인자의 탐색파일 정의 및 방법 29
제 4 장 실험 및 평가 31
4.1 Intel Knights Landing 31
4.2 Intel Xeon Scalable 34
제 5 장 결론 37
참고문헌 38

최근 본 자료

전체보기

댓글(0)

0