메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
김남균 (한국공학대학교) 윤현석 (한국공학대학교) 김응태 (한국공학대학교)
저널정보
한국방송·미디어공학회 한국방송미디어공학회 학술발표대회 논문집 한국방송·미디어공학회 2023 하계학술대회
발행연도
2023.6
수록면
488 - 491 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 Deep Learning Computer Vision 분야는 인간의 능력을 뛰어넘는 능력들을 보여주고, 다양한 분야의 영상처리에서 유용하게 사용되고 있다. Computer Vision의 한 분야로 Single image super resolution(SISR)이 있다. 이는 단일 이미지를 x2, x3, x4, x8 등의 Upscale 하여 저해상도의 이미지를 고해상도의 이미지로 재구성해준다. 위의 기술은 열화상 영상을 만들기 위한 적외선 센서의 비용적, 성능적 한계로 인해 주로 다루어지는 저해상도의 열화상 영상 데이터를 다양한 곳에 활용 가능하도록 고해상도 이미지로 변환하기에 굉장히 유용하다.
이에 본 논문은 다양한 Super resolution 모델들의 성능을 비교 분석한다. 모델의 종류로는 Deep convolution neural network(심층 합성곱 신경망)를 기본 구조로 이루어진 SRCNN [1]. 이를 기반으로 이미지 생성 모델인 적대적 신경망(GAN, Generative adversarial network)모델인 SRGAN [2]이 발전한 Real-ESRGAN [3] 그리고 트랜스포머(Transformer) 기반의 SwinIR [4], HAT [5] 등이 있다. 위 모델들의 육안으로 보이는 성능, 모델의 무게를 나타내는 파라미터의 수, 모델을 학습하는데 걸리는 시간 과 학습된 모델이 테스트 이미지를 처리하는 시간을 비교 분석한다.
또한 Real-ESRGAN 모델에 Thermal dog and people dataset을 fine-tuning하여 열화상(Thermal, Infrared) 데이터를 입력 데이터로 필요로 하는 분야에 기존 사전학습 모델보다 뛰어난 열화상 사전학습 모델을 제안한다.

목차

요약
1. 서론
2. 정량적 모델 비교
3. 정성적 모델 비교
4. Fine-Tuning
5. 미세조정 및 결과
참고문헌

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0102-2023-567-001938449