메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김지후 (서울대학교, 서울대학교 대학원)

지도교수
홍성수
발행연도
2022
저작권
서울대학교 논문은 저작권에 의해 보호받습니다.

이용수7

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
객체 탐지는 이미지를 입력으로 받아 객체들의 분류(Classification)와 위치 탐지(Localization)를 수행하는 컴퓨터 비전 기술이다. 최근에 객체 탐지에 많이 사용되고 있는 딥러닝은 높은 계산량을 요구한다는 것이 알려져 있다. 따라서 객체 탐지를 가속하려는 연구들은 대부분 딥러닝 모델을 가볍게 최적화하여 딥러닝 추론(Inference) 시간을 단축시키려 한다. 이런 연구들 중 YOLO(You Look Only Once)는 적당한 정확도와 빠른 추론 속도로 객체 탐지를 위한 대표적인 딥러닝 모델 중 하나로 자리잡았다. 그러나 객체 탐지 응용의 종단 간 지연 시간(end-to-end latency) 관점에서 봤을 때, 추론뿐만 아니라 image fetch, 전처리, 후처리, 화면 출력 등 다른 여러 과정들도 상당한 실행 시간을 차지한다. 또한 멀티쓰레드 객체 탐지 응용에서는 객체 탐지의 각 과정에 소모되는 시간이 중첩되어 종단 간 지연 시간을 단축시키는 것이 어렵다. 본 논문에서는 YOLO를 기반으로 한 멀티쓰레드 객체 탐지 응용인 Darknet-YOLO의 종단 간 지연 시간을 단축시키기 위한 3가지 기법을 소개한다. 우리는 응용에서 나타나는 blocking time을 분석하고, 이를 제거할 수 있는 해결책을 구현한다. 또한 각 쓰레드의 수행시간을 예측하고 쓰레드의 시작 시간을 동적으로 조절한다. 마지막으로 상당한 계산량을 필요로 하는 preprocessing 함수들을 GPU가 idle할 때 GPU에서 수행하도록 한다. 본 기법은 Nvidia Xavier AGX Jetson에서 평가되었다. Nsight System과 Nvidia Tools Extension(NVTX)를 사용하여 프로파일링 한 결과, Darknet-YOLO의 종단 간 지연 시간은 58.18% 단축되었다.

목차

제 1 장 서 론 5
제 2 장 Darknet-YOLO 10
제 3 장 문제 정의 및 해결 기법 13
제 1 절 Blocking time elimination 14
제 2 절 Late fetch 18
제 3 절 Accelerated computing of preprocessing 20
제 4 장 실험 및 결과 22
제 1 절 실험 환경 22
제 2 절 구현 및 실험 평가 23
제 5 장 관련 연구 25
제 1 절 객체 탐지 응용의 딥러닝 추론 시간 단축 25
제 2 절 딥러닝 추론 이외 과정의 실행 시간 단축 26
제 6 장 결 론 29
참고문헌 30
Abstract 33

최근 본 자료

전체보기

댓글(0)

0