메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

정지영 (울산대학교, 울산대학교 일반대학원)

지도교수
김성현
발행연도
2020
저작권
울산대학교 논문은 저작권에 의해 보호받습니다.

이용수15

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
시장조사기관 MarketsandMarkets에 따르면 텍스트 분석 시장은 2022년까지 약 87억 9,000만 달러 규모에 이를 전망이다. 이처럼 텍스트 데이터의 가치가 높아지면서, 텍스트 분석에 관한 다양한 연구가 필요하게 되었다. 현재 텍스트 데이터는 의료 서비스, 음성 인식 서비스 등의 분야에서 활발히 사용되고 있지만, 고장진단 분야에 텍스트 분석을 적용한 경우는 없었다. 본 논문에서는 텍스트 마이닝과 딥 러닝을 활용하여, 텍스트 분석을 고장진단 분야에 적용하는 방법을 제안한다.
본 연구의 목표는 전력설비 고장현상 진단 데이터를 분석하여 고장의 원인을 제공한 부서(또는 회사)를 예측하는 알고리즘을 구축하는 것이다. 기존의 방식으로 조치관이 고장 원인 업체를 찾는 것은 평균 2~3주의 긴 시간이 소요된다. 그 이유는 제품 하나에 10,000가지가 넘는 부품이 들어가며, 여러 협력업체와 거래하기 때문에 원인 제공 업체를 특정 짓는 것에 어려움이 있기 때문이다. 따라서 예측 알고리즘을 통해 고장 원인 규명에 걸리는 시간을 단축할 필요가 있다. 알고리즘 구축을 통한 기대효과로는 조치시간 단축뿐만 아니라 인건비 및 비용 최소화, 통계 및 시각화를 통한 협력업체 선정 기준 제공이 있다.
본 연구에서는 특징 추출 및 특잇값 삭제 단계와 Tokenization, Vectorization 등의 데이터 전처리 과정을 통해 텍스트 데이터를 분석 가능한 형태로 만들어주었다. 그 후 CNN과 RNN을 비롯한 딥 러닝 모델부터 Logistic Regression 등 분류에 효과적인 머신 러닝 모델들을 다양하게 실험하였으며, 높은 성능의 모델들을 선별하여 최적화하였다. 이때, 딥 러닝을 원활하게 사용하기 위해 입력 변수 크기를 줄여주었고, GPU를 활용하여 처리 속도를 빠르게 해주었다. 그리고 알고리즘의 정확도를 높이기 위해 두 개 이상의 모델을 만들고 다중 예측 시스템을 구축하였으며, GUI 프로그래밍을 통해 현장에서 조치관이 알고리즘을 사용하기 편리하도록 만들었다. 마지막으로, 가장 최근에 수집된 데이터에 알고리즘을 적용하고 성능을 측정해보았다.

목차

1. 서론 1
1.1 연구배경 1
1.2 연구목적 2
1.3 연구내용 2
2. 이론적 배경 4
2.1 빅데이터의 개념 4
2.2 텍스트 마이닝 개념 및 연구 사례 6
2.3 텍스트 마이닝 기법 7
2.4 고장진단 이론 및 연구 사례 8
2.5 머신 러닝과 딥 러닝 8
2.6 주요 모델 10
3. 연구 방법 13
3.1 데이터 전처리 15
3.1.1 데이터 확인 및 목표 설정 15
3.1.2 Feature 추출 16
3.1.3 데이터 교정 16
3.1.4 데이터 정제 17
3.1.5 Tokenization 18
3.1.6 Feature Engineering 18
3.1.6.1 Vectorization 19
3.1.6.2 단어-빈도순위 치환 20
3.2 데이터 분석 20
3.2.1 GPU 가속 20
3.2.2 이상적인 조건에서의 실험 21
3.2.2.1 머신 러닝 21
3.2.2.2 딥 러닝 22
3.2.3 실제 조건에서의 실험 25
3.2.3.1 단일 예측 25
3.2.3.2 다중 예측 28
3.3 GUI 프로그래밍 31
4 결론 및 보완점 33
참고문헌 34
ABSTRACT 38

최근 본 자료

전체보기

댓글(0)

0