메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

박정화 (고려대학교, 高麗大學校 컴퓨터情報通信大學院)

지도교수
白斗權
발행연도
2016
저작권
고려대학교 논문은 저작권에 의해 보호받습니다.

이용수1

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
일반적으로 관계형 데이터베이스 시스템 간의 인터페이스 또는 데이터 수집은 JDBC(Java Database Connectivity)를 기반으로 배치 프로그래밍된 수집 모듈을 통해 이뤄진다. 그 이유는 ETL(Extraction, Transformation, Loading) 도구의 경우 별도의 지식이 필요하여 교육이 필요하다는 점과 구입비용이 발생한다는 점 등 진입장벽이 존재하기 때문이다. 하지만 JDBC를 기반으로 배치프로그래밍을 할 경우 수집모듈 구현 시 고려되어야 하는 사항들이 명확히 제시되어 있지 않아 개발자 개인능력에 의해 수집모듈의 성능이 영향을 받기 쉽다. 또한 일반적으로 배치프로그래밍 시 활용하는 구현 방법은 각각의 규모가 작은 다수의 데이터 집합을 수집하는 것은 효과적이지만 방대한 크기의 단일 데이터 집합을 수집할 경우 성능이 급격히 저하된다는 점이 있다. 더불어, 현재 시스템 자원 상황을 고려하지 않고 고정된 임의의 값을 배치 및 커밋 사이즈로 설정하여 데이터를 수집하기 때문에 수집성능이 저하되는 문제점이 있다. 이에 본 연구에서는 위와 같은 문제를 해결하기 위해 대용량의 단일 데이터 집합을 다수의 수집모듈로 나눠 수집하는 방법과 수집하는 데이터의 크기를 고려하여 배치 및 커밋 사이즈를 동적으로 설정하는 방법 제시해 위 문제를 개선하였다.

목차

요 약 = 1
1. 서론 = 8
1.1 연구의 목적 = 8
1.2 연구의 범위 = 11
2. 연구배경 및 관련연구 = 12
2.1 데이터 수집 성능에 영향을 미치는 요인 = 12
2.1.1 Lock = 12
2.1.2 Row Lock = 12
2.1.3 Table Lock = 13
2.1.4 동시성 제어 = 14
2.1.5 오라클의 DML처리 구조 = 15
2.2 오라클에서 데이터를 수집하는 방법 = 17
2.2.1 SQL Loader = 17
2.2.2 Extraction Transformation Loading = 20
2.2.3 ETL 도구 = 22
2.2.4 JDBC 배치프로그래밍 = 22
2.3 관련연구 = 26
2.3.1 ETL 데이터 이관의 성능 향상에 관한 연구 = 26
2.3.2 데이터 마이그레이션을 위한 오픈소스 ETL도구 평가 = 26
3. 다중 쓰레드를 활용한 데이터 수집 기법 = 27
3.1 제안하는 수집 방법 = 27
3.1.1 전체 아키텍처 = 27
3.1.2 자원 모니터링 모듈 = 29
3.1.3 수집기 생성 모듈 = 33
3.1.4 데이터 할당모듈 = 34
4. 테스트 환경 및 결과 = 38
4.1 테스트 장비 사양 = 38
4.2 소스 데이터 = 39
4.3 테스트 시나리오 = 43
4.4 Talend와 제안 수집방법 성능 비교 = 44
4.4.1 Talend 테스트 = 44
4.4.2 제안 수집방법 테스트 = 47
4.4.3 테스트 결과 비교 및 평가 = 47
5. 결론 = 53

최근 본 자료

전체보기

댓글(0)

0