메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
오늘날의 NUMA 컴퓨터들에서 선형대수 및 행렬연산 등의 문제들을 구현하는데, BLAS는 사실상의 표준(de facto standard)으로서 사용자에게 높은 이식성, 효율성, 그리고 사용상의 편리성을 제공해 준다. LAPACK과 같은 선형대수 연산 패키지를 BLAS를 사용하여 구현되어 효율성과 이식성이 매우 좋다.
병렬컴퓨터에서 완전한 병렬화된 BLAS를 구현하는 최초의 노력으로 PB-BLAS가 개발되었다. PB-BLAS는 프로세서 내에서의 연산을 위한 BLAS 루틴의 호출과 프로세서간 통신을 위한 BLAS 호출로 이루어져 있다. PB-BLAS는 병렬처리 컴퓨터상에서 Level 2와 Level 3 BLAS의 일반적인 모든 행렬의 연산을 위한 것이 아니며, 블록 순환법에 의해 분산된 행렬들이 특수하게 나열되어 있을때만 연산이 가능하도록 만들어졌다.
그러나 현재 공개되어 있는 PB-BLAS 2.0은 사용상에 많은 제약 조건이 있고, 경우에 따라서는 성능과 메모리 관리에 비효율적인 요소를 내포하고 있다. 본 논문에서는 기존의 PB-BLAS를 개선한 PB-BLAS 3.0의 구성과 구현에 대하여 다루었다.

목차

요약

1. 서론

2. 블록순환분산법과 LCM 블록

3. PB - BLAS 3.0의 구성 및 구현

4. 결론

참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2009-569-017975834