메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김기훈 (강원대학교, 강원대학교 대학원)

지도교수
이창기
발행연도
2021
저작권
강원대학교 논문은 저작권에 의해 보호받습니다.

이용수15

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (5)

초록· 키워드

오류제보하기
상호참조해결(Coreference Resolution)은 주어진 텍스트에서 같은 개체를 의미하는 멘션(mention)들을 하나의 엔티티(entity)로 묶어주는 자연어처리 태스크이다. 여기에서 멘션은 상호참조 대상이 되는 명사(구), 대명사(구)를 의미하며, 중심어(head)와 수식어로 구성되어있다. 엔티티는 같은 개체를 의미하는 멘션들의 집합으로, 상호참조해결의 출력 결과물이 된다.
기존의 상호참조해결 연구방식은 상호참조 대상이 되는 멘션 후보를 식별하는 멘션 탐지(Mention Detection)단계와 뽑힌 멘션 후보들을 입력으로 받아 상호참조해결을 진행하는 상호참조해결 단계로 나누어 진행된다. End-to-end 신경망 기반 상호참조해결은 주어진 문서에서 모든 스팬(span)을 멘션 후보로 간주하고, 스팬 표현을 만들어 멘션 탐지와 상호참조해결을 동시에 학습하는 모델이다. 이 모델은 스팬 랭킹 모델로 멘션과 선행사 간의 스코어를 통하여 참조관계를 식별한다.
본 논문에서는 한국어 상호참조해결을 위하여 End-to-end 상호참조해결 모델을 기반으로 하며, 한국어 특성을 반영하기 위한 자질(개체명, 의존구문분석)과 많은 양의 한국어 코퍼스를 사전 학습한 BERT를 이용하고, Entity Eqaulization을 통한 고차추론 방식을 사용한 한국어 End-to-end 신경망 기반 상호참조해결 모델을 제안한다. 또한 부족한 한국어 상호참조해결 데이터를 증강하기 위하여 대명사-고유명사 교체, 괄호 제거, EDA(Easy Data Augmentation)와 같은 규칙 기반 데이터 증강 방법과 BERT를 이용한 딥 러닝 방식의 데이터 증강 방법으로 부족한 한국어 상호참조해결 데이터를 증강하는 방법을 제안한다.

목차

Ⅰ. 서론 1
1. Contribution 1
Ⅱ. 관련연구 4
1. 포인터 네트워크 기반 상호참조해결 4
2. End-to-end 신경망 기반 상호참조해결 모델 5
1) 스팬 표현 5
2) 스코어링 아키텍쳐 9
3) 주의 집중 기법을 이용한 고차추론 12
4) 실험 설정 13
5) 실험 결과 16
Ⅲ. End-to-end 신경망 기반 한국어 상호참조해결 성능 개선 17
1. BERT를 이용한 상호참조해결 모델 17
2. 개체명 자질과 의존구문분석 자질 18
3. Entity Equalization을 이용한 고차추론 방법 20
4. 실험 설정 22
5. 실험 결과 24
Ⅳ. 한국어 상호참조해결 데이터 증강 방법 29
1. 규칙 기반 상호참조해결 데이터 증강 방법 29
1) 대명사 고유명사 교체 31
2) 괄호 제거 32
3) EDA(Easy Data Augmentation) 33
2. BERT 기반 상호참조해결 데이터 증강 방법 35
3. 실험 설정 38
4. 실험 결과 38
Ⅴ. 결론 44
□ 참고문헌 47
□ Abstract 48

최근 본 자료

전체보기

댓글(0)

0