메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
이상원 (영남대학교) 최현철 (영남대학교)
저널정보
대한전자공학회 대한전자공학회 학술대회 2024년도 대한전자공학회 추계학술대회 논문집
발행연도
2024.11
수록면
674 - 677 (4page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 이미지 초해상도(Super-Resolution) 연구는 성능 개선의 한계에 도달했다. 이를 해결하기 위해 음성을 활용한 Multi-Modal 기법이 제안되고 있다. 하지만 기존 연구는 단순한 Multi-Layer Perceptron만을 사용해 Fusion Network를 구성해 서로 다른 모달리티 간 깊은 상관관계를 효과적으로 학습하기 어려웠다. 본 논문에서는 Transformer 기반의 Fusion Network을 활용해 음성으로부터 영상에서 부족한 세부 정보를 보완하는 새로운 접근 방식을 제안한다. 또한, 오디오-비디오 데이터셋을 활용해 제안한 네트워크가 음성 데이터를 통해 얼굴의 특징 정보를 효과적으로 추출할 수 있음을 입증하였다.

목차

Abstract
I. 서론
II. 본론
III. 실험
Ⅳ. 결론 및 향후 연구 방향
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0