메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

안치경 (성균관대학교, 成均館大學校)

지도교수
金東郁
발행연도
2016
저작권
성균관대학교 논문은 저작권에 의해 보호받습니다.

이용수3

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
상호정보를 이용한 변수선택법은 반응변수와 설명변수간의 선형적인 연관성뿐만 아니라 비선형적인 연관성을 감지하며, 설명변수 사이의 연관성도 고려가 가능한 좋은 변수선택 방법이다. 하지만 고차원 자료에서 상호정보를 추정하기가 쉽지 않아 이에 대한 연구가 필요하다. Cai 등 (2009)은 조건부 상호정보를 이용한 전진선택법과 가지치기법을 이용하여 이러한 문제를 해결하였으며, 마이크로어레이 자료와 같은 고차원 자료에서 조건부 상호정보를 이용한 변수선택법으로 선택된 변수들로 구성된 SVM의 분류 성능이 SVM-RFE 및 기존의 필터링 방법으로 선택된 변수들로 구성된 SVM의 분류 성능보다 뛰어남을 보였다. 하지만 조건부 상호정보를 추정할 때 사용된 비모수적 방법은 변수의 수가 많아질수록 변수선택 시간이 길어지는 단점으로 인해 이에 대한 보완이 필요하다.
본 연구에서는 설명변수의 분포를 특정 분포로 가정하여 조건부 상호정보를 준모수적인 방법으로 추정하는 방법을 제시하였다. 설명변수와 반응변수간에는 비모수적으로 추정하여 설명변수와 반응변수간의 비모수적 연관성을 감지하는 상호정보의 장점을 유지하면서 추정의 어려움이 있는 설명변수간의 상호정보는 모수적 가정을 통해 추정의 효율을 향상시킬 수 있다. 첫 번째로 제시하는 방법은 설명변수간의 상호정보를 모수만의 식으로 표현하거나 근사하여 상호정보의 추정량을 모수의 추정량을 통하여 구하는 방법이다. 이러한 모수적 추정은 비모수적 추정에서 수행되는 수치적분 과정과 밀도함수 추정과정이 생략되어 매우 빠르게 상호정보를 추정할 수 있다. 특히 설명변수간의 2차원 상호정보를 Edgeworth 근사를 통해서 추정하는 조건부 상호정보의 준모수적 추정량은 비모수적인 추정량의 유의변수 선택능력과 비교해볼 때 근접한 성능을 보여주었다는 결론을 모의실험과 실제자료 실험을 통하여 제시하였다. 두 번째로 제시하는 방법은 설명변수간의 상호정보를 비모수적 추정방법과 유사하게 수치적분 형태로 추정하는 방법이다. 비모수적 추정방법과의 차이점은 밀도함수의 추정이 커널을 이용한 비모수적 추정을 하지 않고 모수의 추정으로 이루어진다는 것이다. 첫 번째로 제시한 방법보다 이상치와 분포가정에 대해서 상대적으로 강건하여 혼합 정규분포를 가정한 변수선택법이 매우 우수한 변수선택법이라는 결론을 실험을 통하여 제시하였다. 또한 본 연구에서는 반응변수와 단조적 연관성이 있는 설명변수를 선택하기 위한 순서형 상호정보를 정의하였다. 순서형 상호정보를 변수선택법으로 활용하기 위해 순서형 조건부 상호정보를 정의하고 순서형 조건부 상호정보의 비모수적 추정량과 준모수적 추정량을 제시하고 순서형 상호정보는 순서형 변수와 연속형 변수의 단조적 연관성을 나타내기에 적합한 척도라는 결론을 제시하였다.
본 연구는 조건부 상호정보의 준모수적 추정량이 순서형 반응변수, 다범주 반응변수를 포함한 고차원 자료 분류분석의 전처리 방법으로도 활용할 수 있고 기존 변수선택방법과 유사하거나 혹은 더 우수한 분류성능을 보여준다는 것에 의의가 있다.

목차

제1장 서 론 1
1.1 기존의 상호정보를 이용한 변수선택법 2
1.2 본 연구에서 해결하고자하는 문제점 3
제2장 문헌 연구 6
2.1 엔트로피와 엔트로피 6
2.1.1 엔트로피 6
2.1.2 상호정보 8
2.2 조건부 상호정보를 기반으로 한 변수선택법 11
2.2.1 조건부 상호정보를 이용한 변수선택 11
2.2.2 가지치기 전략을 포함한 상호정보를 이용한 변수선택 13
2.2.3 Parzen window 밀도 추정을 통한 상호정보 추정 17
2.3 SVM과 SVM-RFE 20
2.3.1 SVM (Support Vector Machines) 20
2.3.2 SVM-RFE 22
2.4 B.632+ 오분류율 24
2.5 최적변수의 수를 찾기 위한 정보 기준의 활용 27
2.5.1 KRIC (Kernel regularization information criterion) 27
2.5.1.1 SVM에 대한 로지스틱 베이지안 모형 27
2.5.1.2 RIC (Regularization information criterion) 29
2.5.1.3 로지스틱 베이지안 모형에서의 KRIC 29
2.5.2 SVMIC (SVM information criterion) 34
제3장 조건부 상호정보의 준모수적 추정 38
3.1 준모수적 조건부 상호정보 추정량 38
3.2 설명변수간 정규분포 가정 40
3.3 Edgeworth 근사법을 이용한 준모수적 추정 42
3.3.1 다변량 누율과 Hermite 다항식 42
3.3.2 Edgeworth 근사를 이용한 엔트로피 계산 45
3.3.3 Edgeworth 근사를 이용한 조건부 상호정보 추정 47
3.4 설명변수간 혼합정규분포 가정 50
3.4.1 혼합정규분포를 가정한 엔트로피 계산 50
3.4.2 혼합정규분포를 가정한 조건부 상호정보 추정 52
3.4.3 혼합정규분포를 가정한 새로운 조건부 상호정보의 준모수적 추정 55
3.5 이산형 독립변수를 위한 변수선택법 59
3.6 모의실험 60
3.6.1 고정효과 모의실험 60
3.6.2 변동효과 모의실험 69
3.6.2 추가 모의실험 76
제 4 장. 반응변수가 다범주일 경우의 조건부 상호정보의 추정량 80
4.1 반응변수가 명목형일 경우의 조건부 상호정보의 추정량 80
4.1.1 반응변수가 명목형일 경우 조건부 상호정보의 비모수적 추정량 80
4.1.2 반응변수가 명목형일 경우 조건부 상호정보의 준모수적 추정량 81
4.2 반응변수가 명목형일 경우의 조건부 상호정보의 추정량 82
4.2.1 순위 상호정보 83
4.2.2 순서형 상호정보 86
4.2.2.1 순서형 조건부 상호정보의 비모수적 추정량 91
4.2.2.2 순서형 조건부 상호정보의 준모수적 추정량 93
4.2.2.3 Edgeworth 근사를 이용한 순서형 자료에서의 조건부 상호정보 추정 94
4.2.2.4 혼합정규분포를 가정한 순서형 자료에서의 조건부 상호정보 추정 96
4.3 반응변수가 다범주인 경우의 모의실험 100
4.3.1 반응변수가 3범주일 경우의 모의실험 100
4.3.2 반응변수가 순서형 3범주일 경우의 모의실험 107
4.3.3 반응변수가 순서형 4범주일 경우의 모의실험 112
제 5 장. 실제 자료를 이용한 실험 117
5.1 실험에 사용된 자료 117
5.2 유전자 선택방법 과정 및 교차 타당성 117
5.3 실제 자료를 이용한 실험의 결과 118
제 6 장. 결론 및 토의사항 122
6.1 조건부 상호정보 준모수적 추정량의 의미 122
6.2 혼합정규분포 가정에서의 문제점과 가중치의 활용 123
6.3 순서형 상호정보의 의미 124
6.4 향후 연구과제 126
참고문헌 127
부 록 130

최근 본 자료

전체보기

댓글(0)

0