메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
전영황 (한국전자기술연구원) 김희탁 (한국전자기술연구원) 김병수 (한국전자기술연구원) 황태호 (한국전자기술연구원)
저널정보
대한전자공학회 전자공학회논문지 전자공학회논문지 제61권 제7호(통권 제560호)
발행연도
2024.7
수록면
43 - 50 (8page)
DOI
10.5573/ieie.2024.61.7.43

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
Systolic array를 사용하여 GEMM 가속기를 구현할 때 가장 큰 문제점은 병렬로 처리할 데이터의 개수를 늘릴 때 기하급수적으로 더 많은 연산기가 필요하다는 것이다. 예를 들어 Systolic array는 N 크기의 입력을 병렬로 처리하기 위해서는 2N²의 연산기를 포함해야 한다. 따라서, 본 논문에서는 N개의 데이터를 병렬로 처리할 때 N개의 곱셈기와 N-1개의 덧셈기를 사용하여 총 2N-1개의 연산기를 사용할 수 있는 adder-tree 기반의 GEMM 가속기 구조를 제안한다. 이에 따라 Systolic array 대비하여 탑재되는 연산기의 수를 획기적으로 줄일 수 있었다. 또한, 본 논문에서는 가속기 내부에서 데이터를 최대한 재활용하여 외부 메모리 접근 수를 줄일 수 있는 알고리즘과 더불어 하드웨어 처리량을 높일 수 있는 Pipelined 하드웨어 구조를 제안한다. 제안하는 가속기는 부동소수점 (Floating-point) 연산기를 사용하여 구현되었으며, 40㎚ CMOS 공정으로 합성하였고 49831.59㎛²의 면적 및 580㎒의 최대 주파수를 가진다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 기존 GEMM 알고리즘 및 가속기 구조
Ⅲ. 제안하는 GEMM 가속기 구조
Ⅳ. 구현 결과 및 분석
Ⅳ. 결론
REFERENCES

참고문헌 (13)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-25-02-090923399