메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

양해미 (고려대학교, 高麗大學校 大學院)

지도교수
鄭然敦
발행연도
2013
저작권
고려대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
최근, 다양한 인터넷 서비스의 등장으로 다루어야 할 데이터의 양이 증가하고 있고, 이러한 대용량 데이터 분석에 대한 관심이 매우 높아지고 있다. 대용량 데이터 분석은 다양한 집계 질의가 많이 사용되는데, 이를 효율적으로 처리하기 위해 데이터 큐브가 사용된다.
본 논문은 맵리듀스에서 대용량 데이터에 대한 새로운 데이터 큐브 생성 기법을 제안한다. 기존 데이터 큐브 생성 기법은 단일 머신 또는 적은 수의 노드로 구성된 클러스터 환경에 최적화 되어 있어, 알고리즘의 확장성에 문제가 있다. 또한, 맵리듀스와 같은 분산 환경에서 고려해야 하는 네트워크 비용 문제를 고려하지 않았다. 그렇기 때문에, 기존 데이터 큐브 생성 기법은 맵리듀스에서 대용량 데이터에 대해 데이터 큐브를 생성하기에 적합하지 않다. 따라서, 본 논문은 맵리듀스에서 대용량 데이터에 대해 데이터 큐브를 생성할 때 중간 결과 크기를 줄임으로써 네트워크 비용을 감소시켜 전체 질의 처리 시간을 단축시키는 새로운 데이터 큐브 생성 기법을 제안한다. 성능 평가를 통해, 데이터와 차원 속성의 수가 증가함에 따라 제안 기법이 비교한 기법들 보다 더 성능이 뛰어남을 보인다.

목차

1장 서론 5
2장 관련 연구 9
2.1 데이터 큐브 9
2.2 기존 데이터 큐브 연구 10
3장 연구 동기 13
4장 제안 기법 15
4.1 큐브 격자에서 큐보이드 간 종속 관계 15
4.2 큐보이드 그룹 17
4.3 큐브 생성 기법 19
5장 성능 평가 26
5.1 실험 환경 26
5.2 실험 결과 27
5.2.1 데이터 크기 증가에 따른 수행 시간 및 중간 결과 27
5.2.2 차원 속성 수 증가에 따른 수행 시간 및 중간 결과 29
6장 결론 31
참고 문헌 32

최근 본 자료

전체보기

댓글(0)

0