메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

박근령 (서강대학교, 서강대학교 대학원)

지도교수
박석
발행연도
2021
저작권
서강대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
스카이라인(Skyline) 이란, 다차원 데이터 셋에서 주어진 차원을 모두 고려하는 경우에 어떤 데이터 개체에게도 지배당하지 않는 데이터 개체들의 집합이라고 할 수 있다. 그룹 스카이라인이란, 스카이라인 개념을 집합으로 확장한 것으로 그룹 크기가 주어 졌을 때 동일한 크기의 집합에 지배당하지 않는 그룹의 집합이다. 본 논문에서는 주어진 개체가 그룹 스카이라인에 포함되기 위한 최소 비용을 찾는 Why-not 그룹 스카이라인 질의를 제안한다. Why-not 그룹 스카이라인 질의는 기본적으로 다차원 공간 안에서 연속적인 공간을 해공간(Solution space)으로 가지기 때문에 시간 복잡도가 크다. 우리는 무한한 해 공간을 유한한 해 공간으로 한정하고 무차별 대입 기법으로 질의 처리 과정을 설명한다. 이 때, 무차별 대입 기법으로 문제를 해결하기 위해서는 현실에서는 사용할 수 없는 정도의 질의 처리 시간이 걸리게 된다. 따라서 데이터에 대한 시간 복잡도의 의존도를 실용적으로 사용할 수 있는 수준까지 낮출 수 있는 알고리즘을 제안한다. 먼저 다중 레이어를 고려한 baseline알고리즘인 KL알고리즘을 제안하여 전체 데이터 개수에 영향을 크게 받지 않는 것을 보이고, Group Element를 고려한 GE 알고리즘을 제안하여 질의 처리 시간이 주어진 그룹의 크기에 영향을 적게 받는 것을 보인다. 더하여 하한을 정의하여 가지치기 기법을 제안한다. 제한적이지만 질의처리 속도를 매우 개선시킬 수 있는 GE+알고리즘을 소개한다. 실험에서는 제안 기법의 가지치기 성능이 실제 문제에 적용할 수 있다는 것을 알 수 있다.

목차

1. 서 론 1
1.1 연구의 배경 및 동기 1
1.2 논문의 초점 3
1.3 논문의 구성 4
2. 관련 연구 6
2.1 Why-not 질의 처리 7
2.2 스카이라인 질의 처리 8
2.3 스카이라인에서의 why-not 질의 처리 9
2.4 기존 연구의 문제점 10
3. Why-not 그룹 스카이라인 질의 11
3.1 문제 정의 11
3.2 선행 처리 13
3.3 무차별 대입 기법 15
4. Why-not 그룹 스카이라인 질의 처리 기법 23
4.1 기반 알고리즘 23
4.2 GROUP ELEMENT를 고려한 제안기법 28
4.3 하한을 이용한 가지치기 기법 32
4.4 GROUP ELEMENT를 고려한 향상된 제안기법 35
4.5 향상된 알고리즘에서의 하한을 이용한 가지치기 기법 40
5. 실험 및 분석 44
5.1 실험 설계 44
5.2 Synthetic 데이터에서의 질의 처리 속도 평가 45
5.2.1 데이터 수에 따른 질의 처리 속도 측정 46
5.2.2 그룹 크기 (K)에 따른 질의 처리 속도 측정 48
5.3 실제 데이터에서의 질의 처리 속도 평가 55
5.3.1 그룹 크기 (K)에 따른 질의 처리 속도 측정 56
5.3.2 차원 수에 따른 질의 처리 속도 측정 60
6. 결론 및 추후연구 64
참고 문헌 66

최근 본 자료

전체보기

댓글(0)

0