메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김태진 (국민대학교, 국민대학교 비즈니스IT전문대학원)

지도교수
김남규
발행연도
2021
저작권
국민대학교 논문은 저작권에 의해 보호받습니다.

이용수26

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
최근 텍스트 데이터와 이미지 데이터를 활용한 딥러닝 기술의 발전에 힘입어, 두 분야의 융합 분야인 이미지 캡셔닝에 대한 연구가 활발히 이루어지고 있다. 이미지 캡셔닝은 주어진 이미지에 대한 설명을 텍스트로 생성하는 기술이며, 이미지 이해와 텍스트 생성을 동시에 다루고 있다. 다양한 활용 가능성 때문에 인공지능 연구의 핵심 분야로 자리 잡고 있으며, 성능을 향상을 위한 여러 연구가 꾸준히 이루어지고 있다.
하지만 이러한 다양한 노력에도 불구하고, 이미지를 일반인의 관점이 아닌 특정 분야별 전문가의 시각에서 ‘해석’하기 위한 연구는 찾아보기 어렵다. 같은 이미지에 대해서도 그 이미지를 접한 사람의 전문 분야에 따라 집중해서 주목하는 부분이 다를 뿐만 아니라, 전문성의 수준에 따라 이를 표현하고 해석하는 방식도 상이하다. 따라서 본 연구에서는 전문가의 전문성을 모델에 이식하는 방법을 제안하고, 이를 통해 해당 분야에 특화된 이미지의 캡션을 생성하는 방안을 제안한다.
구체적으로 제안 방법론은 대량의 일반 데이터에 대해 학습을 수행해 사전 학습 모델을 구축한 후, 소량의 전문 데이터를 전이 학습해 해당 분야의 전문성을 이식한다. 또한, 본 연구에서는 학습 과정에서 발생할 수 있는 관찰간 간섭 문제를 방지하기 위해 ‘특성 독립 전이 학습’ 방법을 제안한다. 제안 방법론의 검증을 위해 MSCOCO의 이미지 캡셔닝 데이터 셋을 활용하여 사전 학습 모델을 구축하고, 실제 미술 치료사의 자문을 토대로 생성된 ‘이미지-전문 캡션‘ 데이터를 통해 전문성을 이식하는 실험을 수행하였다. 실험 결과 일반적인 관점에서 생성한 일반 캡션은 전문적 해석과 무관한 내용을 포함한 것과는 달리, 제안 방법론을 통해 생성된 전문 캡션은 전문적 해석에 필요한 내용을 모두 포함한 것을 확인하였다.

목차

1. 서론 1
2. 관련연구 7
2.1. 딥러닝 연구: 텍스트와 이미지 활용 7
2.2. 이미지 캡셔닝 연구 9
2.3. 전이 학습 연구 11
2.4. 데이터 분석에 기반한 미술 치료 연구 13
3. 제안 방법론 15
3.1. 관찰/해석 지도(O2I Map) 및 전문성 쿼드(E-Quad) 구축 15
3.2. 특성 독립 전이 학습 모델 구축 16
3.3. 전문 해석 캡션 생성 모델 18
4. 실험 및 결과 21
4.1. 실험 개요 21
4.2. 데이터 특징에 따른 캡션 품질 비교 23
4.3. 일반 캡션과 전문 캡션 비교 28
5. 결론 31
참고문헌 33
Abstract 40

최근 본 자료

전체보기

댓글(0)

0