메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
이상현 (고려대학교) 김재동 (고려대학교) 고한석 (고려대학교)
저널정보
대한전자공학회 전자공학회논문지 전자공학회논문지 제57권 제10호(통권 제515호)
발행연도
2020.10
수록면
45 - 55 (11page)
DOI
10.5573/ieie.2020.57.10.45

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문에서는 음성 감정 인식을 위한 end-to-end 기반의 CRNN-GLU-ATT모델을 제안한다. 제안된 모델은 감정 인식의 강인한 특징 추출을 위한 gated linear units (GLUs)와 attention mechanism (ATT)모듈을 적용한 convolutional recurrent neural network (CRNNs) 모델이다. 기존 연구에서 오디오 감정 인식은 사람의 목소리의 강세, 음율, 에너지를 고려하여 특징추출하였다. 이때, 특징에 대한 전처리 과정과 모델 학습 과정이 독립적으로 나뉘었다. 이러한 감정 특징과 인식기 모델을 독립적으로 연구하기 때문에 특정 전문가와 시간적 비용이 발생하였다. 그러나, 최근 음성인식 분야에서 제안한 end-to-end 방식을 감정 인식에 적용하여 전처리 과정 없이 심층 신경망으로 특징과 모델을 총괄 학습하여 최적의 모델을 생성한다. 본 논문에서 제안한 end-to-end 기반 CRNN-GLU-ATT모델은 로컬과 글로벌 특징을 고려한 강점과 GLUs, ATT 모듈을 추가하여 감정 성분의 중요 정보에 가중을 더하여 강인한 특징을 학습한다. 또한, 강인한 특징 모듈 중 GLUs를 시각화하여 감정 특징을 분석한다. 실험은 공인 데이터로 영어로 발화된 Interactive emotional dyadic motion capture database (IEMOCAP)와 독일어로 발화된 EmoDB를 사용하였다. IEMOCAP는 4가지 감정 분노, 행복, 중립, 슬픔을 사용하였고 EmoDB는 확장하여 7가지 감정을 인식한다. IEMOCAP은 약 16%로 향상되었으며 EmoDB 데이터는 최신 성능과 비교하여 3% 차이를 보였다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 관련 연구
Ⅲ. 제안 방법
Ⅳ. 실험 결과
Ⅴ. 시각화와 오디오 분석
Ⅵ. 결론
REFERENCES

참고문헌 (44)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0