본 논문에서는 독일어 대화의 순차적, 계층적 구조를 분석하고, 이를 활용하여 기계학습 기반의 대화 자동요약 모델을 제안하였다. 대화요약이란 주어진 대화를 그 대화에서 가장 중요한 내용이 담긴 문장들로 짧게 줄이는 것이다. 본 논문에서는 기존의 대화요약 방법론이 단어와 같은 발화의 표층 정보에만 의존하는 문제점을 지적하였다. 대화에는 생략, 수정, 말더듬, 추임새와 같은 현상들이 종종 등장하므로 표층 정보만을 활용하여 대화를 자동으로 요약하기는 어렵기 때문이다. 뿐만 아니라 대화는 둘 이상의 화자가 참여하는 특수한 언어 사용의 유형이기 때문에 화자 간의 상호작용을 고려하는 것이 대화 자동요약을 위해 매우 중요하다. 본 논문에서는 대화의 구조를 순차적 구조와 계층적 구조로 나누어 대화를 심층적으로 분석하고, 이를 바탕으로 한 대화요약 방법론을 제안하였다. 대화는 화자들이 주고받는 여러 개의 상호작용으로 구성된다. 대화의 순차구조 분석은 대화에서 화자들이 어떤 상호작용을 주고받는지 구분하여 대화의 흐름을 이해할 수 있게 한다. 대화를 구성하는 상호작용들을 파악하기 위해 본 논문에서는 상호작용 단위의 경계에 있는 발화가 어떤 언어학적 특징들을 갖는지 음성, 어휘, 의미, 대화의 측면에서 분석하였다. 그리고 이를 이용하여 대화를 상호작용 단위로 자동분절하는 기계학습 모델을 구현하였다. 독일어 대화 코퍼스인 FOLK를 이용하여 실험을 진행하였고, 대화 자동분절 모델의 정확도를 측정한 결과 89.43%로 나타났다. 추가적으로 CNN, BERT 등과 같은 딥러닝 모델의 성능과 비교하여 본 논문에서 제안한 대화의 순차구조 분석 방법론의 타당성을 검증하였다. 화자들이 상호작용을 수행하기 위해 주고받는 발화들에는 각 화자가 상호작용을 수행하기 위해 전달하는 가장 핵심적인 발화 뿐만 아니라 이를 보충, 전제하기 위한 부수적인 발화들이 존재한다. 화자 간의 상호작용에서 가장 핵심적이고 중요한 발화쌍이 무엇인지 추출함을 통해, 화자들이 전달하고자 하는 핵심 내용이 무엇인지 파악할 수 있다. 본 논문은 체면 위협의 최소화라는 대화 원리와 발화의 의미적, 담화적 특징을 고려하여 상호작용 단위별로 핵심 발화쌍을 추출하는 방법론을 제안하였다. 이를 기계학습 모델로 구현하고 실험을 진행한 결과 제안한 방법론은 80.0%의 정확도를 보였다. 본 논문에서 제안하는 자동요약 모델은 대화의 순차적, 계층적 구조 분석을 활용하여 구현되었다. 이 모델은 데이터 전처리, 순차구조 분석, 계층구조 분석, 요약문 생성의 단계를 거쳐 최종적으로 요약문을 출력한다. 본 논문에서는 상호작용 단위별로 추출된 핵심 발화쌍 중 통계적으로 가장 요약문일 확률이 높은 발화쌍을 최종 요약문으로 선택하는 방법을 제안하였다. Deutsche Welle에서 수집한 대화를 독일어 대화 자동요약 모델로 요약하고 평가한 결과, 모델이 약 88%의 정확도로 올바른 요약문을 추출하는 것을 확인할 수 있었다.
In der vorliegenden Arbeit wurde eine computerlinguistische Studie zur automatischen Zusammenfassung eines deutschen Dialogs mithilfe von sequenzieller und hierarchischer Struktur des Dialogs unternommen. Unter dem Begriff „Dialogzusammenfassung“ versteht man einen Prozess, wo ein gegebenes Dialog mit die Sätze verkürzt wird, die nur die wichtigsten Inhalte des Dialogs enthalten. Um herauszufinden, welche Äußerungen aus dem Dialog für das Verständnis des Dialogs wichtig sind, ist es notwendig, auf die linguistischen Besonderheiten eines Dialogs Rücksicht zu nehmen. Es gibt zwei oder mehrere Teilnehmer an einem Dialog. Die Teilnehmer des Dialogs wechseln den Redebeitrag(engl. turn) kooperativ ab und vollziehen einen Dialog. Und jeder Sprecher stellt systematisch die Äußerungen in seinem Redebeitrag auf, um seine Absichten gut zu vermitteln. Eine weitere Besonderheit eines Dialogs in Bezug auf die Dialogzusammenfassung ist, dass Ellipsen, Reparaturen und unflüssigen Phänomene wie Stottern und Füllern häufig auftreten. Daher ist es schwierig, ein Dialog nur mit oberflächlichen Informationen wie Wörtern automatisch zusammenzufassen. Die meisten der auf Computerlinguistik basierenden Untersuchungen zur Dialogzusammenfassung haben jedoch diese linguistischen Besonderheiten des Dialogs nicht eingehend berücksichtigt. Sie untersuchen nicht die Struktur des Dialogs, z.B. wie der Sprecher die Äußerungen seines Redebeitrags(engl. turn) anordnet und wie die Redebeiträge des Sprechers zu einem Dialog zusammenfügt. Sie stützen sich hauptsächlich nur auf die Wörter in Äußerungen. In der vorliegenden Arbeit wird eine Dialogstruktur für die automatische Zusammenfassung des Dialogs in ihre sequentielle und hierarchische Struktur unterteilt. Bevor das in dieser Arbeit vorgeschlagene Dialogzusammenfassungsmodell diskutiert wird, wurden im zweiten Kapitel verschiedene Arten von Dialogzusammenfassungen, z.B. extraktive und abstraktive Zusammenfassung, und ihre jeweiligen Merkmale untersucht. Insbesondere wurden die bisherige Forschungen zur Zusammenfassung eines deutschen Textes und Dialogs erläutert. Im dritten Kapitel wurde gezeigt, wie die sequentielle Struktur eines Dialogs analysiert werden kann. Ein Dialog besteht aus verschiedenen Interaktionen zwischen Sprechern. Um ein Dialog zu verstehen, ist es von Bedeutung herauszufinden, was für Interaktionen zwischen den Dialogteilnehmern erstellt wurden. Diese Arbeit zeigt, wie wichtig Segmentierung von einem Dialog in Interaktionen zwischen Sprechern für die Dialogzusammenfassung ist. Darüber hinaus wurden verschiedene linguistische Eigenschaften von den Äußerungen im Dialog für die Segmentierung vorgeschlagen. Eine Segmentierung des Dialogs in die vorliegenden Interaktionen des Dialogs, aus denen er besteht, ermöglicht herauszufinden, welche Interaktionen im Dialog vorliegen. Diese Segmentierung wird hier die sequentielle Strukturanalyse des Dialogs genannt. In dieser Arbeit wurden für die sequentielle Strukturanalyse die phonetischen, lexikalischen, semantischen Merkmale und Konversationsmerkmalen von Äußerungen herangezogen. Mit diesen Merkmalen wurde ein Maschinelles Lernen Modell implementiert, das einen Dialog automatisch in die Interaktionen im Dialog segmentiert. Das Modell wurde mit dem deutschen Konversationskorpus FOLK trainiert und evaluiert. Das Experiment zeigt, dass der vorgestellte Ansatz 89,43% Korrektheit aufweisen kann. Im vierten Kapitel wurde die Analyse von hierarchischer Struktur des Dialogs behandelt. Durch die Analyse von der sequentiellen Struktur wurde ein Dialog in Interaktionen aufgeteilt. Die Interaktionen zwischen Sprechern werden grundsätzlich durch Paarsequenz(engl. adjacency pair) realisiert, die jeweils von zwei Sprechern geäußert werden. Im Dialog können jedoch mehrere Äußerungen um Paarsequenz herum zusätzlich hinzugefügt werden. Das hat verschiedene Gründe. Unter anderem konzentriert sich diese Arbeit auf das Prinzip des Dialogs, das besagt, dass man die durch Äußerungen verursachte Bedrohung des Gesichts für die Gestaltung sozialer Beziehungen zu vermeiden versucht. Zudem wurde die Beziehung zwischen den Schlüsseläußerungspaaren und den zusätzlichen Äußerungen, die die gesamten Interaktionen des Dialogs bilden, analysiert. Dafür wurden Diskurs- und semantische Merkmale z.B. die Position in der Interaktionseinheit und die semantische Repräsentativität von Äußerungen vorgeschlagen. Die Extrahierung der wichtigsten und dominantesten Äußerungspaare aus Interaktionen, ermöglicht zu erfahren, welche die wichtigsten Äußerungen jedes Sprechers sind, um die Interaktion auszuführen. Diese Extrahierung wird in dieser Arbeit die hierarchische Strukturanalyse des Dialogs genannt. Vier linguistische Merkmale wurden herangezogen, um ein Maschinelles Lernen Modell aufzubauen, das das Schlüsseläußerungspaar automatisch von Interaktion herauszieht. Dieses Modell wurde auch mit dem deutschen Korpus FOLK trainiert und evaluiert. Das Experiment zeigt, dass der vorgestellte Ansatz 80,0% Korrektheit aufweisen kann. Das fünfte Kapitel beschäftigt sich mit dem Maschinelles Lernen Modell zur automatischen Zusammenfassung eines deutschen Dialogs. Das vorgeschlagene Modell durchläuft die Datenvorverarbeitung, die Analyse von sequentielle und hierarchische Strukturanalyse und die Generierung von der Zusammenfassung. Zuerst wurde in der Datenvorverarbeitung das Dialogkorpus in Äußerungen unterteilt. Dann wurde jeder Äußerung Informationen über Sprecher und Sprechakt beigefügt. Als nächstes wurde der Dialog durch die sequentielle Strukturanalyse in Interaktionen segmentiert, und danach durch die hierarchische Strukturanalyse wurden Schlüsseläußerungspaare für jede Interaktion extrahiert. Schließlich wurde ein für die Zusammenfassung am besten geeignetes Schlüsseläußerungspaar ausgewählt und wurde damit die Zusammenfassung des Dialogs erzeugt. In diesem Kapitel wurden sechs deutsche Dialoge gesammelt von ‚Deutsch Welle‘ durch das vorgeschlagenen Modell automatisch zusammengefasst. In dieser Arbeit wurden die von vier Annotatoren ausgewählten Äußerungspaare als die Richtige angesehen. Um das Modell zu evaluieren, wurde sie mit den durch das Modell extrahierten Äußerungspaaren verglichen. Das Modell ergab eine Korrektheit von 87,84%. Im Vergleich zu vorherigen Methoden wie LexRank und TextRank weist die in dieser Arbeit vorgeschlagene Methode eine höhere Korrektheit auf. Abschließend wurden die Ergebnisse dieser Arbeit zusammengefasst und die wissenschaftliche Bedeutung und Anwendungsmöglichkeit der Studie diskutiert. Außerdem wurden die Themen zukünftiger Arbeiten, wie ein Modell zur Dialogzusammenfassung entsprechend der Gesprächsdomäne, eine Methode zur Generierung von Zusammenfassungen und eine Methode zur Zusammenfassung von Mehrpersonengesprächen, vorgestellt.
제1장 서론 11. 연구 주제 12. 연구 배경 43. 연구 방법론 7제2장 기존 연구 111. 대화요약, 문서요약 112. 추출요약, 추상요약 143. 독일어 요약 17제3장 대화의 순차구조 분석 211. 이론적 배경 211) 인접쌍 212) 최소대화 243) 대화원형 272. 상호작용 단위 분절 291) 휴지 322) 중첩 353) 단서 단어 384) 정보량 405) 의미적 관련성 426) 화행 467) 의사소통 진행 정도 498) 인접 화행쌍 509) 화자 5210) 차례 전환 533. 실험 561) 실험 설계 562) 실험 데이터 603) 실험 결과 644) 실험 결과 분석 685) 모델 간 비교 76제4장 대화의 계층구조 분석 801. 이론적 배경 801) 수사 구조 이론 802) 인접쌍의 확장 833) 대화 핵의 변이 862. 핵심 발화쌍 추출 891) 인접쌍의 확장 유형 942) 인접쌍의 확장 가능성 1043) 상호작용 단위 내의 발화 위치 1084) 의미적 대표성 1103. 실험 1111) 실험 설계 1112) 실험 데이터 1123) 실험 결과 1194) 실험 결과 분석 1205) 모델 간 비교 128제5장 대화 구조를 활용한 대화 자동요약 1301. 전체 프로세스 1302. 실험 1381) 실험 데이터 1382) 실험 결과 1393) 실험 분석 141제6장 결론 1461. 연구 결과 1462. 연구 의의 1503. 향후 연구 152참 고 문 헌 155부 록 176<부록 1> SWBD-DAMSL 태그 목록 176<부록 2> 화행별 의사소통 진행 유형 178<부록 3> 인접 화행쌍 179<부록 4> 인접쌍별 확장 시퀀스 유형 (예시) 182<부록 5> 화행 유형별 강도 185<부록 6> FOLK 데이터 통계정보 186<부록 7> FOLK 데이터 (예시) 187<부록 8> DW 데이터 통계정보 189<부록 9> DW 데이터와 각 대화별 요약문 190ZUSAMMENFASSUNG 198