메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

정주은 (서울시립대학교, 서울시립대학교 일반대학원)

지도교수
김한준
발행연도
2023
저작권
서울시립대학교 논문은 저작권에 의해 보호받습니다.

이용수2

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
본 연구에서는 데이터 품질 향상을 목표로, 혼합형 데이터에 대한 균형잡힌 증강을 위한 BAMT-GAN(Balanced Augmentation for Mixed Tabular GAN)이라는 새로운 데이터 증강 기법을 제안한다. BAMT-GAN은 생성 모델, 클러스터링, 오버샘플링 기법을 결합하여 데이터 불균형 문제를 해결하며, 이를 통해 데이터의 다양성을 증가시키고 결과적으로 생성된 예측모델의 정확도를 향상시킨다. 이 기법은 유사한 특성을 가진 데이터를 클러스터링하고, CNN 기반 GAN 모델을 이용해 새로운 데이터를 생성하는 과정을 포함한다. 다양한 분류 알고리즘을 통합하여 정확한 예측값을 도출하고, 층화 추출법을 이용해 균형 잡힌 데이터셋을 최종적으로 구성한다. 우리는 의료, 마케팅, 금융, 환경 도메인에서 생성된 다양한 데이터셋을 활용하여 실험을 수행하였으며, 이를 통해 BAMT-GAN이 기존 데이터 증강 기법에 비해 데이터 불균형을 효과적으로 해결하고, 예측모델의 성능을 상당히 향상시킴을 확인하였다. 즉 BAMT-GAN을 활용한 데이터 증강 작업을 통해 고신뢰도 예측모델을 구축하는데 필요한 학습데이터의 품질을 대폭 향상시킬 수 있다.

목차

제 1 장 서 론 1
제 1 절 연구의 배경 및 내용 1
제 2 절 논문의 구성 3
제 2 장 관련 연구 4
제 1 절 데이터 증강 4
제 2 절 생성 모델과 샘플링 기법 7
1. GAN 7
2. 샘플링 기법 : 오버샘플링과 언더샘플링 9
제 3 절 데이터 증강 모델 연구 동향 10
1. GAN 기반 테이블 데이터 증강 모델 10
2. DeepSMOTE 12
제 3 장 BAMTGAN : 혼합형 데이터 증강 기법 13
제 1 절 개요 13
제 2 절 혼합형 데이터 증강 기법 15
1. Record Clustering 15
2. Data Generation 17
3. Loss function 23
4. Classification 24
5. Augmentation 25
제 4 장 실험 방법 및 결과 26
제 1 절 실험 환경 26
1. 실험 데이터 26
2. 파라미터 설정 29
제 2 절 실험 방법 30
제 3 절 성능 평가 33
1. 분류 모델의 정확도 및 F1-score 33
2. Augmented Improvement 47
3. Augmentation 전/후 성능 비교 50
4. 증강 전/후 클래스 분포 비교 51
5. 샘플 크기에 대한 데이터 증강 영향 비교 53
6. 기존 모델과 제안 모델의 성능 비교 55
제 5 장 결 론 60
참 고 문 헌 61
Abstract 65

최근 본 자료

전체보기

댓글(0)

0