메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이민혜 (숙명여자대학교, 숙명여자대학교 대학원)

지도교수
노호석
발행연도
2019
저작권
숙명여자대학교 논문은 저작권에 의해 보호받습니다.

이용수15

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
최근에 부정맥 환자가 증가하면서 부정맥을 예측하는 연구가 활발하게 진행되고 있다. 기존의 많은 연구들은 특정한 시점의 RR 간격 데이터에서 추출한 특징변수 다변량 데이터에 기반하여 부정맥을 예측하였다. 본 연구에서는 심장 상태가 시간에 따라 변해가는 패턴도 부정맥 예측에 중요한 정보가 될 수 있다고 생각하여 다변량 시계열을 기반으로 생성된 데이터로 부정맥을 예측하는 분류 러너를 생성하고 그 분류 성능을 다변량 데이터 기반 러너와 비교하였다.
먼저 특징변수별로 분류 러너를 만들어 성능을 비교하였다. 52개 특징변수 각각의 값 또는 시계열에 기반하여 1-Nearest Neighbor(1-NN) 분류 러너를 구축하고 Leave-One-Out Cross-Validation (LOOCV)으로 정분류율을 계산하여 분류 성능을 평가하였다. 이때 데이터 클래스의 불균형 문제로 인해 언더샘플링을 실시하였으며 언더샘플링을 100번 반복 후 정분류율을 평균한 값으로 분류 성능을 평가하였다. 특징변수의 시계열 데이터 간의 거리는 R package TSclust에서 제공하는 CID, COR, CORT, DTWARP, EUCL 5가지 거리 함수를 사용하여 계산하였다. 그 결과 DTWARP로 시계열간 거리를 계산했을 때 시계열 기반 1-NN이 값 기반 1-NN과 비교했을 때 분류 성능 향상이 가장 좋았으며 그 다음으로 CID, CORT가 좋았고 그 다음으로 EUCL이 좋았다. 거리 함수가 COR인 경우에는 오히려 성능 저하를 가져오는 것을 확인하였다.
특징변수별 분류 러너를 앙상블한 것의 성능을 비교할 때는 시계열 간 거리 함수는 DTWARP만 사용하였다. 최종 성능 비교를 위해서 언더샘플링을 100번 반복했을 때, 다변량 시계열 기반 앙상블 러너의 정분류율이 다변량 기반 앙상블 러너의 정분류율과 같거나 큰 횟수의 비율을 고려하였다. 그 결과 다변량 시계열을 기반으로 앙상블한 것의 성능이 다변량 기반으로 앙상블한 것의 성능보다 더 좋음을 확인하였다.

목차

1. 연구 배경 및 개요 = 1
2. 용어 설명 = 2
2.1. 부정맥 = 2
2.2. RR 간격(RR interval) = 2
3. 분석 = 4
3.1 원 데이터 설명 = 4
3.2 분석 데이터 생성 = 8
3.2.1 다변량 데이터 생성 = 8
3.2.2 다변량 시계열 데이터 생성 = 10
3.3 분석 = 13
3.3.1 특징변수별 분류 러너의 성능 비교 = 13
3.3.2 특징변수별 분류 러너를 앙상블한 것의 성능 비교 = 21
4. 결론 및 전망 = 23

최근 본 자료

전체보기

댓글(0)

0