메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

구영은 (성균관대학교, 성균관대학교 일반대학원)

지도교수
홍문표
발행연도
2023
저작권
성균관대학교 논문은 저작권에 의해 보호받습니다.

이용수11

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (7)

초록· 키워드

오류제보하기
본 논문에서는 독일어 대화의 순차적, 계층적 구조를 분석하고, 이를 활용하여 기계학습 기반의 대화 자동요약 모델을 제안하였다. 대화요약이란 주어진 대화를 그 대화에서 가장 중요한 내용이 담긴 문장들로 짧게 줄이는 것이다. 본 논문에서는 기존의 대화요약 방법론이 단어와 같은 발화의 표층 정보에만 의존하는 문제점을 지적하였다. 대화에는 생략, 수정, 말더듬, 추임새와 같은 현상들이 종종 등장하므로 표층 정보만을 활용하여 대화를 자동으로 요약하기는 어렵기 때문이다. 뿐만 아니라 대화는 둘 이상의 화자가 참여하는 특수한 언어 사용의 유형이기 때문에 화자 간의 상호작용을 고려하는 것이 대화 자동요약을 위해 매우 중요하다. 본 논문에서는 대화의 구조를 순차적 구조와 계층적 구조로 나누어 대화를 심층적으로 분석하고, 이를 바탕으로 한 대화요약 방법론을 제안하였다.
대화는 화자들이 주고받는 여러 개의 상호작용으로 구성된다. 대화의 순차구조 분석은 대화에서 화자들이 어떤 상호작용을 주고받는지 구분하여 대화의 흐름을 이해할 수 있게 한다. 대화를 구성하는 상호작용들을 파악하기 위해 본 논문에서는 상호작용 단위의 경계에 있는 발화가 어떤 언어학적 특징들을 갖는지 음성, 어휘, 의미, 대화의 측면에서 분석하였다. 그리고 이를 이용하여 대화를 상호작용 단위로 자동분절하는 기계학습 모델을 구현하였다. 독일어 대화 코퍼스인 FOLK를 이용하여 실험을 진행하였고, 대화 자동분절 모델의 정확도를 측정한 결과 89.43%로 나타났다. 추가적으로 CNN, BERT 등과 같은 딥러닝 모델의 성능과 비교하여 본 논문에서 제안한 대화의 순차구조 분석 방법론의 타당성을 검증하였다.
화자들이 상호작용을 수행하기 위해 주고받는 발화들에는 각 화자가 상호작용을 수행하기 위해 전달하는 가장 핵심적인 발화 뿐만 아니라 이를 보충, 전제하기 위한 부수적인 발화들이 존재한다. 화자 간의 상호작용에서 가장 핵심적이고 중요한 발화쌍이 무엇인지 추출함을 통해, 화자들이 전달하고자 하는 핵심 내용이 무엇인지 파악할 수 있다. 본 논문은 체면 위협의 최소화라는 대화 원리와 발화의 의미적, 담화적 특징을 고려하여 상호작용 단위별로 핵심 발화쌍을 추출하는 방법론을 제안하였다. 이를 기계학습 모델로 구현하고 실험을 진행한 결과 제안한 방법론은 80.0%의 정확도를 보였다.
본 논문에서 제안하는 자동요약 모델은 대화의 순차적, 계층적 구조 분석을 활용하여 구현되었다. 이 모델은 데이터 전처리, 순차구조 분석, 계층구조 분석, 요약문 생성의 단계를 거쳐 최종적으로 요약문을 출력한다. 본 논문에서는 상호작용 단위별로 추출된 핵심 발화쌍 중 통계적으로 가장 요약문일 확률이 높은 발화쌍을 최종 요약문으로 선택하는 방법을 제안하였다. Deutsche Welle에서 수집한 대화를 독일어 대화 자동요약 모델로 요약하고 평가한 결과, 모델이 약 88%의 정확도로 올바른 요약문을 추출하는 것을 확인할 수 있었다.

목차

제1장 서론 1
1. 연구 주제 1
2. 연구 배경 4
3. 연구 방법론 7
제2장 기존 연구 11
1. 대화요약, 문서요약 11
2. 추출요약, 추상요약 14
3. 독일어 요약 17
제3장 대화의 순차구조 분석 21
1. 이론적 배경 21
1) 인접쌍 21
2) 최소대화 24
3) 대화원형 27
2. 상호작용 단위 분절 29
1) 휴지 32
2) 중첩 35
3) 단서 단어 38
4) 정보량 40
5) 의미적 관련성 42
6) 화행 46
7) 의사소통 진행 정도 49
8) 인접 화행쌍 50
9) 화자 52
10) 차례 전환 53
3. 실험 56
1) 실험 설계 56
2) 실험 데이터 60
3) 실험 결과 64
4) 실험 결과 분석 68
5) 모델 간 비교 76
제4장 대화의 계층구조 분석 80
1. 이론적 배경 80
1) 수사 구조 이론 80
2) 인접쌍의 확장 83
3) 대화 핵의 변이 86
2. 핵심 발화쌍 추출 89
1) 인접쌍의 확장 유형 94
2) 인접쌍의 확장 가능성 104
3) 상호작용 단위 내의 발화 위치 108
4) 의미적 대표성 110
3. 실험 111
1) 실험 설계 111
2) 실험 데이터 112
3) 실험 결과 119
4) 실험 결과 분석 120
5) 모델 간 비교 128
제5장 대화 구조를 활용한 대화 자동요약 130
1. 전체 프로세스 130
2. 실험 138
1) 실험 데이터 138
2) 실험 결과 139
3) 실험 분석 141
제6장 결론 146
1. 연구 결과 146
2. 연구 의의 150
3. 향후 연구 152
참 고 문 헌 155
부 록 176
<부록 1> SWBD-DAMSL 태그 목록 176
<부록 2> 화행별 의사소통 진행 유형 178
<부록 3> 인접 화행쌍 179
<부록 4> 인접쌍별 확장 시퀀스 유형 (예시) 182
<부록 5> 화행 유형별 강도 185
<부록 6> FOLK 데이터 통계정보 186
<부록 7> FOLK 데이터 (예시) 187
<부록 8> DW 데이터 통계정보 189
<부록 9> DW 데이터와 각 대화별 요약문 190
ZUSAMMENFASSUNG 198

최근 본 자료

전체보기

댓글(0)

0