메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

전준하 (성균관대학교, 성균관대학교 일반대학원)

지도교수
문태섭
발행연도
2021
저작권
성균관대학교 논문은 저작권에 의해 보호받습니다.

이용수8

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
딥뉴럴 네트워크가 의료 분야에 미치는 영향이 급속히 커지고 있다. 실제로 의료 분야에 딥뉴럴 네트워크가 유용하게 쓰이기 위해서는 모델의 높은 정확도가 필수적이다. 하지만 의료 데이터는 다른 분야의 데이터보다 양이 적기 때문에 학습데이터에 모델이 쉽게 과적합하는 경향이 있다. 따라서 모델을 일반화(generalize)하기 위한 방법이 필요하다. 이를 해결할 수 있는 방법 중에 하나로 제시되는 것이 Interpretation Regularization (IR) 기술이다. IR 알고리즘은 사전 지식을 모델에 주입하여 모델이 일반화된 학습을 하도록 한다. 이 알고리즘은 XAI 기술을 이용해 모델의 예측에 많이 기여한 입력 특징(feature)을 구하고 그 특징이 사전 지식으로부터 얻은 중요한 특징과 일치하도록 학습을 규제한다. 이렇게 모델에 사전 지식이 주입되고 모델은 일반화되어 처음 보는 입력에 대한 정확도가 향상된다.
IR 알고리즘을 이용하면 의료 데이터에서 모델이 과적합하는 문제를 막을 수 있다고 생각할 수 있지만 그렇게 단정하기는 어렵다. 아직 IR 알고리즘이 의료 데이터가 흔히 가지는 어려운 환경에서 분류 모델의 정확도를 향상시킬 수 있는지에 대한 연구가 충분히 진행되지 않았기
때문이다. 본 연구에서는 의료 영상 분류 작업에 IR 이 효과적인지를 검증하기 위해 의료 데이터가 흔히 가지는 두가지 환경을 설정하고 IR 알고리즘들의 분류 성능을 측정했다. 첫번째로 데이터의 개수가 적으면서 모델의 과적합을 유도하는 특징이 입력에 삽입된 데이터셋으로
IR 알고리즘들의 정확도를 측정했다. 둘째로 분할 라벨의 개수가 적은 환경에서 IR 알고리즘들의 정확도를 측정했다. 분할 라벨은 IR 알고리즘이 중요한 특징의 위치 정보를 모델에 주입할 때 사용된다. 하지만 분할 라벨을 만드는데 시간과 비용이 많이 필요하기 때문에 분할 라벨의 양이 적은 환경에서도 IR 알고리즘이 충분히 높은 분류 성능을 가지는지 확인할 필요가 있다. 그리고 대표적인 5 개의 XAI 기술을 IR 에 적용해보고 어떤 XAI 기술을 사용했을 때 높은 정확도를 얻을 수 있는지 실험했다. 이 실험들을 진행한 결과 IR 알고리즘 중에서 Grad-CAM 을 사용하는 IRGrad-CAM 이 일반적으로 높은 정확도를 가지는 것을 발견했다. 또한 IRLRP, IR-Grad-CAM, IR-IG 가 나머지 알고리즘들에 비해 과적합을 효율적으로 막아낸다는 것을 보였다. 그리고 분할 라벨의 개수가 적은 환경에서 실험한 결과 IR 알고리즘은 분할 라벨을 입력 데이터 개수의 30%-50% 정도만 사용해도 전부 사용했을 때의 정확도를 거의 유지했다는 것을 발견했다. 의료 분할 라벨을 만드는데 시간과 비용이 많이 발생하는데 이런 IR 의 특성은 IR 이 의료 영상 분류 작업에 매우 유용하게 사용될 수 있다는 것을 보여준다.

목차

제1장 서론 1
제2장 관련 연구 4
제1절 XAI 4
1. Simple Gradient 4
2. LRP (Layer-wise Relevance Propagation) 5
3. Grad-CAM 6
4. Integrated Gradient (IG) 8
5. SmoothGrad (SG) 9
제2절 Interpretation Regularization (IR) 10
1. 마스크를 사용하는 IR 10
2. 마스크를 사용하지 않는 IR 11
제3장 구현 방법 12
제4장 실험 15
제1절 실험 설정 15
1. 공통 설정 15
2. Decoy Human Against Machine10000 (Decoy HAM10000) 데이터셋 16
3. Medical Segmentation Decathlon (MSD) 간 & 비장 데이터셋 18
4. 분할 라벨의 양에 따른 분류 성능 측정 실험 19
제2절 실험 결과 21
1. Decoy HAM10000 데이터셋 21
2. MSD간 & 비장 데이터셋 23
3. 분할 라벨의 양에 따른 분류 성능 측정 실험 25
4. 기존 IR 알고리즘과 비교 27
5. 해석 계층 선정 실험 29
제5장 결론 30
참고문헌 31
Abstract 34

최근 본 자료

전체보기

댓글(0)

0