메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
이상원 (영남대학교) 최현철 (영남대학교)
저널정보
대한전자공학회 대한전자공학회 학술대회 2024년도 대한전자공학회 하계학술대회 논문집
발행연도
2024.6
수록면
1,663 - 1,667 (5page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
최근 음성으로부터 얼굴 이미지를 생성하려는 연구가 진행되고 있다. 하지만 대다수 연구들은 사전 정의된 특징에 대해서만 추론할 수 있는 지도학습 방식이다. 비지도 학습 방식으로 수행된 몇몇 연구들은 학습이 불안정하거나, multi-modal 학습에 적절하지 않은 loss를 사용했다. 본 논문에서 우리는 비지도 학습 방식으로 multi-modal 학습에 적합한 학습 방식을 제안하고, 기존의 연구들과 다르게 StyleGAN의 disentanglement한 특성을 활용해 자연스러운 얼굴 이미지를 생성한다. 그리고 오디오-비디오 데이터셋을 활용해 제안하는 네트워크가 음성으로부터 높은 해상도의 얼굴 영상을 추론할 수 있음을 보였다.

목차

Abstract
Ⅰ. 서론
Ⅱ. 본론
Ⅲ. 실험
Ⅳ. 결론 및 향후 연구 방향
참고문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

최근 본 자료

전체보기

댓글(0)

0