메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
차재빈 (연세대학교) 황서림 (연세대학교) 박성욱 (강릉원주대학교) 박영철 (연세대학교)
저널정보
한국통신학회 한국통신학회논문지 한국통신학회논문지 제48권 제9호
발행연도
2023.9
수록면
1,064 - 1,071 (8page)
DOI
10.7840/kics.2023.48.9.1064

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
음성 향상 기술은 음성의 잡음을 제거하고 명료도를 높이는 기술로서, 음성 인식, 화상 회의 등 다양한 분야에서 활용된다. 최근에는 DNN 기반의 음성 향상 기술이 주목받고 있으며, 특히 음성 신호의 로컬 및 글로벌 정보를 효과적으로 활용하는 중첩 U-Net 모델이 우수한 성능을 보인다. 음성 향상 기술의 활용도를 높이기 위해서는 스마트폰 같은 엣지 디바이스에서 실시간 실행이 가능해야 한다. 본 논문에서는 중첩 U-Net 기반 최신 모델 중 하나인 NUNet-TLS를 스마트폰 앱에서 실시간 구현하였다. NUNet-TLS에 사용된 dilated convolution은 빈번한 메모리 사용으로 긴 연산 시간을 요구하는데, dilated convolution을 LSTM(Long-Short Term Memory)으로 대체함으로써 메모리 사용량과 연산 시간을 크게 줄일 수 있었다. 제안 모델은 데이터 입/출력을 프레임 단위로 처리하도록 변경하여 앱으로 구현되었으며, 이 앱은 실시간 실행에서 기존 모델보다 메모리 사용량이 적지만 동등한 음성 향상 성능을 보여주었다.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. DNN 기반 음성 향상 모델
Ⅲ. 실시간 구현을 위한 모델 최적화
Ⅳ. 실시간 음성 향상 앱
Ⅴ. 실험
Ⅵ. 결론
References

참고문헌 (18)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0102-2023-567-002051367