메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

박준희 (호서대학교, 호서대학교 일반대학원)

지도교수
문남미
발행연도
2022
저작권
호서대학교 논문은 저작권에 의해 보호받습니다.

이용수93

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
본 논문은 사용자로부터 얻을 수 있는 음성 및 텍스트 데이터를 동시에 사용하는 멀티모달 분석 기반 어텐션 우울증 감지 시스템을 제안한다. 우울증 장애는 지속적으로 환자수가 증가하여 사회적으로 문제가 되고 있기 때문에 이를 멀티모달분석을 통해 해결하고자 한다. 제안하는 모델은 텍스트 전처리, 음성 전처리, 멀티모달 분석 및 융합모델로 구성되어있다. 전처리 단계에서 음성 파일은 로그-멜 스펙트로그램으로 변환하고 랜덤 샘플링 작업을 진행하여 우울증과 비우울증에 대한 균형을 50:50의 비율로 학습데이터세트를 구축한다. 로그-멜 스펙트로그램은 어텐션이 적용된 CNN-BiLSTM(Convolutional Neural Network-Bidirectional Long-Short Term Memory) 모델을 통해 특징을 내포하고 있는 벡터를 구한다. 텍스트 데이터는 분석을 위해 Transformers Tokenizer를 사용하여 임베딩 벡터 형태로 전처리하고 우울증 라벨을 기준으로 데이터의 균형을 50:50으로 맞추는 랜덤 샘플링을 진행한다. 임베딩 벡터는 BERT(Bidirectional Encoder Representations from Transformers)-CNN 모델의 파인튜닝을 위해 사용하고 최종적으로 우울증을 분류하기 위한 특징 벡터를 구한다. 최종적으로 각각의 음성 및 텍스트 분석 모델에서 추출된 특징 벡터를 연결하고 SoftMax 함수를 사용하여 우울증을 감지하는 것으로 한다.
본 논문의 실험은 불안, 우울증 및 외상 후 스트레스와 같은 심리적 고통 상태의 진단을 지원하도록 설계된 임상 인터뷰인 DAIC-WOZ 데이터셋을 사용하여 진행한다. 음성 데이터는 전처리 과정에서 각각 음성 길이 및 멜 필터 개수 비교를 통해 4초 길이와 128개로 설정하였다. 텍스트 데이터는 인터뷰의 피험자 텍스트 데이터를 사용하고 Transformers Tokenizer를 사용하여 임베딩 벡터를 도출하였다. 각각의 데이터를 기반으로 본 논문에서 제안한 BERT-CNN 및 CNN-BiLSTM을 모델을 적용하고 결합하여 우울증을 분류하였다. 데이터는 학습 데이터, 검증 데이터, 테스트 데이터의 비율을 5.2:0.8:2로 구성하여 분류를 진행하였다.
실험을 통해 멀티모달 데이터를 사용하였을 경우와 단일 데이터를 사용하였을 경우에 대한 각각의 정확도와 손실도를 비교하였으며 기존의 낮은 정확도를 개선함을 확인하였다.

목차

목 차
Ⅰ. 서론 1
1. 연구 배경 1
2. 연구 목적 3
Ⅱ. 관련연구 4
1. 우울증 감지 4
가. 텍스트 데이터 분류 4
나. 음성 데이터 분류 7
다. 멀티모달 분류 10
2. 어텐션 메커니즘 10
Ⅲ. 어텐션 메커니즘 기반 우울증 감지 시스템 13
1. 시스템 개요 13
2. 텍스트 분석 모델 15
3. 음성 분석 모델 17
가. 음성 데이터 전처리 18
나. 어텐션 메커니즘 기반 CNN-BiLSTM 21
4. 멀티모달 융합 모델 22
Ⅳ. 실험 24
1. 실험 구성 24
가. DAIC-WOZ 데이터셋 24
2. 실험 및 결과 26
가. 텍스트 분석 모델 26
나. 음성 분석 모델 24
다. 멀티모달 융합모델 29
라. 실험 결과 30
Ⅴ. 결론 32
참고문헌 33
영문초록 37

최근 본 자료

전체보기

댓글(0)

0