메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

최도진 (충북대학교, 忠北大學校)

지도교수
柳哉秀
발행연도
2020
저작권
충북대학교 논문은 저작권에 의해 보호받습니다.

이용수5

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (9)

초록· 키워드

오류제보하기
소셜 네트워크 서비스의 발전과 함께 다양한 응용에서 객체 간의 관계를 표현하기 위한 그래프 자료구조가 자주 활용되고 있다. 기존의 응용은 그래프 자료구조를 활용하여 가치 있는 정보를 생산하기 위하여 이상 감지, 그래프 클러스터링, 서브 그래프 매칭과 같은 그래프 분석 기법을 활용한다. 그래프 분석의 복잡도를 해결하기 위해서 그래프 분석 기법에 대한 최적화 연구가 활발하게 진행되고 있다. 본 논문에서는 그래프 스트림 환경에서 효율적인 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법에서는 연속 Exact 서브 그래프 매칭과 연속 근사 Top-k 서브 그래프 매칭 질의를 다룬다.
첫 번째, 본 논문에서는 효율적인 분산 연속 서브 그래프 매칭 기법을 제안한다. 제안하는 기법은 대용량 스트림을 효율적으로 처리를 위해서 기존 분산 스트림 처리 플랫폼을 활용하고, 분산 서브 그래프 매칭을 위해 질의 분할 방법, 질의 할당 방법을 제안한다. 그래프의 차수 특성을 활용하여 질의를 분할하고, 분할된 질의를 분산 노드에 할당하여 질의를 분산하여 처리한다. 질의 할당은 분산 처리 시스템에서 특정 노드에 부하가 발생하는 상황을 발생시키지 않기 위하여, 각 노드의 스트림 처리 부하, 색인 부하를 고려한다.
두 번째, 본 논문에서는 불필요한 색인 및 스트림 처리 비용을 감소시키기 위한 색인 재사용 및 선택적 색인 방법을 제안한다. 유사한 서브 그래프 매칭 질의가 자주 발생하면, 각 질의에 대한 결과를 생성하기 위해서 서로 다른 색인을 구축하는 경우가 태반이다. 동일한 데이터에 대한 불필요한 색인은 서버의 부하를 야기한다. 제안하는 기법에서는 유사한 질의에 대한 검사를 수행하여, 기존 색인에 질의 목록에 추가하여 색인 부하를 감소하는 방법을 제시한다. 또한, 질의와 관련된 스트림만을 관리하여 스트림 처리 비용을 감소시킨다.
세 번째, 본 논문에서는 질의의 다양성을 제공한다. 기존 연구에서는 서브 그래프 매칭의 제약 조건으로 레이블, 가중치, 방향성 중 일부만 지원하는 질의를 제안하였다. 제안하는 기법에서는 레이블과 가중치, 그래프의 편집 거리 및 가중치 차이에 대한 연산(+,-,=,*)을 제공하여 사용자에게 질의에 대한 다양성을 제공한다.
마지막으로, 본 논문에서 효율적인 근사 연속 Top-k 서브 그래프 매칭 기법을 제안한다. 제안하는 근사 Top-k 서브 그래프 매칭 기법은 질의와 데이터 그래프 간의 차이 (레이블, 가중치, 편집 거리)를 기반으로 차이가 적은 순으로 k개의 결과를 제공한다. 질의 처리 비용 감소 및 응답성 높은 질의 처리를 수행하기 위해서 정확한 Top-k 개를 생성하지 않고, 근사한 k개의 결과를 제공한다.
제안하는 기법의 우수성을 입증하기 위해 다양한 실세계 그래프 데이터 집합에서의 성능 평가를 수행한 결과 제안하는 기법이 기존 기법보다 우수한 성능을 보였다. 성능 평가 결과, 제안하는 기법이 기존 기법에 비해 분산 시스템의 확장성, 질의 확장성, 스트림 처리량 측면에서 우수한 성능을 나타냈다.

목차

Ⅰ. 서 론 1
1. 연구의 필요성 1
2. 연구 목적 및 특징 4
3. 연구의 구성 6
Ⅱ. 관련 연구 7
1. 용어 정의 7
(1) 그래프 정의 7
(2) 서브 그래프 매칭 8
(3) 연속 서브 그래프 매칭 9
(4) 그래프 스트림 10
2. 서브 그래프 매칭 15
(1) 조인 기반 서브 그래프 매칭 15
(2) Path 기반 서브 그래프 매칭 17
3. 실시간 그래프 스트림 기반 서브 그래프 매칭 19
(1) DAG 기반 서브 그래프 매칭 기법 19
(2) Dominate 기반 서브 그래프 매칭 기법 21
(3) 전이 상태 기반 서브 그래프 매칭 기법 24
4. Top-k 서브 그래프 매칭 27
(1) Wei Chen 기법 27
(2) Xiaohuan Shan 기법 29
Ⅲ. 제안하는 연속 서브 그래프 매칭 기법 33
1. 연구 동기 34
2. 전체 시스템 구조도 37
(1) 전체 처리 절차 37
(2) 질의 스트림 처리 절차 42
(3) 질의 유형 59
3. Exact 연속 서브 그래프 매칭 64
(1) 데이터 색인 64
(2) 부분 서브 그래프 매칭 69
(3) 최종 서브 그래프 매칭 77
4. 근사 Top-k 연속 서브 그래프 매칭 80
(1) D_List 82
(2) 초기 서브 그래프 매칭 85
(3) 연속 서브 그래프 매칭 88
(4) Compaction Manager 90
Ⅳ. 성능 평가 92
1. 성능 평가 환경 92
2. Exact 연속 서브 그래프 매칭 기법 94
(1) 색인 할당 방법 성능 평가 94
(2) 질의 처리 방법 성능 평가 97
3. 근사 Top-k 연속 서브 그래프 매칭 105
4. 성능 평가 결과 108
Ⅴ. 결론 및 향후 연구 111
참고문헌 113

최근 본 자료

전체보기

댓글(0)

0