메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

우덕채 (국민대학교, 국민대학교 일반대학원)

지도교수
조윤호
발행연도
2019
저작권
국민대학교 논문은 저작권에 의해 보호받습니다.

이용수12

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
머신러닝은 통찰력을 도출하거나 분류 및 예측을 하기 위해, 주어진 데이터를 수학적 모델에 적합시키는 방식으로 정보 기술의 발전과 다양한 스마트 기기의 등장으로 활용 가능한 데이터의 양이 기하급수적으로 증대된 빅데이터 시대에서 편향이 개입되지 않은 패턴 발견으로 높은 예측 성능을 보이고 있다. 이러한 머신러닝 수행 과정에서 해결하고자 하는 문제를 잘 설명할 수 있는 속성을 생성하는 특성공학은 머신러닝 성능에 큰 영향을 미쳐 그 중요성이 지속적으로 강조되어 오고 있다. 하지만, 이러한 중요성에도 불구하고 반복적인 검증 절차와 원천 데이터에 대한 이해 뿐만 아니라 도메인 특성에 대한 깊은 이해를 필요로 함에 따라 여전히 어려운 과업으로 여겨지고 있다. 따라서, 본 연구에서는 이러한 특성공학 과업 중 전문 지식을 요구하며 반복적으로 수행되어야 하는 특성 추출의 복잡성 및 어려움을 해결하고 머신러닝 모델의 성능을 높이기 위한 방법으로 딥러닝 기법의 적용을 제안한다. 다른 머신러닝 기법과 달리 복잡한 비정형 데이터 처리 분야에서 딥러닝 기법이 뛰어난 성능을 보이는 가장 대표적인 이유는 원천 데이터 자체로부터 특성 추출이 가능하다는 점이다. 이러한 딥러닝 기법의 장점을 비즈니스 문제 해결에 적용하기 위하여 본 연구에서는 트랜잭션 데이터로부터 자동적으로 특성을 추출하거나 직접 예측 및 분류가 가능한 딥러닝 기반의 방법들을 제안하고 데이터 특성에 따른 차이를 실험하였다. 특히, 트랜잭션 데이터와 텍스트 데이터의 구조적 유사성에 기반하여 기존의 텍스트 처리에 높은 성능을 보이고 있는 기법을 적용하였으며 트랜잭션 데이터의 특성에 따라 각 방법들의 적합성을 검증하였다. 본 연구를 통해 자동화된 특성추출의 가능성을 탐색할 수 있을 뿐만 아니라 특성 추출 과업 수행 전에 일정 수준 이상의 성능을 보이는 준거 모델의 확보가 가능할 것으로 판단된다. 또한, 해결하고자 하는 비즈니스 문제와 보유하고 있는 데이터 특성에 따라 적합한 딥러닝 모델 선택의 가이드라인을 제시할 수 있으리라 기대된다.

목차

제1장 서론 1
1.1 연구 배경 및 목적 1
1.2 연구 방법 5
1.3 논문의 구성 7
제2장 관련 연구 9
2.1 특성 공학 9
2.2 텍스트 분석 (Text Mining) 13
2.2.1 BOW (Bag-Of-Words) 16
2.2.2 Word2Vec 18
2.3 분류 기법 22
2.3.1 CART (Classification And Regression Tree) 22
2.3.2 XGBoost (Extreme Gradient Boost) 23
2.3.3 MLP (Multi Layer Perceptron) 24
2.3.4 SVM (Support Vector Machine) 25
2.4 딥러닝 26
2.4.1 합성곱 신경망(Convolutional Neural Network) 27
2.4.2 순환 신경망(Recurrent Neural Network) 30
2.5 특성 추출과 딥러닝 32
2.6 DFS (Deep Feature Synthesis) 37
2.7 특성 생성 자동화를 위한 Word2Vec응용 38
2.7.1 실험 데이터 및 방법 39
2.7.2 실험 결과 및 분석 49
제3장 특성 추출 자동화 방법 52
3.1 BOW와 Word2Vec 기반 방법 52
3.2 CNN과 RNN기반 방법 54
제4장 실험 및 결과 58
4.1 실험 데이터 및 방법 58
4.2 실험 결과 및 분석 64
제5장 결론 71
5.1 연구의 요약 및 의의 71
5.2 연구의 한계 및 향후 연구 방향 73
참고 문헌 76

최근 본 자료

전체보기

댓글(0)

0