메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

송의석 (국민대학교, 국민대학교 비즈니스IT전문대학원)

지도교수
김남규
발행연도
2022
저작권
국민대학교 논문은 저작권에 의해 보호받습니다.

이용수44

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
소셜 미디어의 등장으로 방대한 양의 텍스트 정보가 온라인상에서 생산 및 유통되면서, 정보 이용자가 많은 정보로부터 필요한 정보만을 추려내는 작업은 더욱 어려워지게 되었다. 이로 인해 방대한 양의 텍스트를 자동으로 요약하기 위한 다양한 시도가 이루어지고 있으며, 특히 최근에는 풍부한 표현의 요약문을 새롭게 생성할 수 있는 추상 요약 접근법에 대한 연구가 활발히 수행되고 있다. 추상 요약 분야에서는 신경망 기반의 트랜스포머 모델이 우수한 성능을 보이며 널리 활용되고 있지만, 충분한 양의 학습 데이터가 확보되지 않으면 트랜스포머를 구성하고 있는 매개변수의 학습이 충분히 이루어지지 않아서 양질의 요약문을 생성하기 어렵다는 한계를 갖는다. 따라서 본 연구는 적은 양의 학습 데이터가 주어진 상황에서도 양질의 요약문을 생성하기 위해, 한국어 사전학습 언어 모델인 KoBERT의 일부 요소를 추출하여 트랜스포머 기반의 추상 요약 모델에 적용하는 문서 요약 방안을 제시한다. 제안 방법론의 우수성을 검증하기 위해 Dacon의 한국어 문서 생성 요약 데이터 42,803건에 대한 요약 실험을 수행한 결과, 제안 방법론이 비교 방법론에 비해 요약 품질을 평가하는 지표인 ROUGE 기준으로 우수한 성능을 보임을 확인하였다.

목차

1. 서론 1
2. 관련 연구 4
2.1. 자동 텍스트 요약 4
2.2. 신경망 기반의 텍스트 요약 6
2.3. 사전학습 언어 모델과 텍스트 요약 7
3. 제안 방법론 10
3.1. 연구 과정 10
3.2. 임베딩 행렬 추출 11
3.3. 사전학습 언어 모델의 토큰 임베딩을 사용한 요약 모델 생성 14
4. 실험 19
4.1. 실험 개요 19
4.2. 실험 평가 방법 22
4.3. 실험 결과 23
5. 결론 27
참고문헌 28
Abstract 32

최근 본 자료

전체보기

댓글(0)

0