메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이병주 (숭실대학교, 숭실대학교 정보과학대학원)

지도교수
최용락
발행연도
2014
저작권
숭실대학교 논문은 저작권에 의해 보호받습니다.

이용수1

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
여러 기업들에서는 고객관계관리를 통해 시장경쟁력을 확보하기 위한 움직임이 활발히 진행되고 있다. 이러한 고객관계관리의 필수 요소라 할 수 있는 것은 고객의 특성 및 행동 모델을 분석하는 것이다.
초기 고객관계관리는 고객의 욕구변화와 행동패턴에 주목하여 데이터를 분석 가능한 형태로 변환하여 분석하는 데이터 마이닝 기법이 많이 사용되었다. 데이터 마이닝은 기업이 보유하고 있는 고객 데이터, 상품 데이터 혹은 각종 활동을 통한 데이터의 분석을 통해 새로운 경향과 규칙을 발견하여 이를 비즈니스 의사결정에 사용하기 위해 활용된다.
기업이 접근할 수 있는 다양한 데이터 중 웹 로그 데이터는 고객관계관리 전략 수행을 위한 데이터 분석에 부합하는 중요한 데이터 중 하나이다.
하지만 인터넷과 스마트폰의 대중화로 접근 가능한 데이터의 양이 기하급수적으로 증가함에 따라 웹 로그 데이터도 많이 증가했다.
이렇게 되므로 대용량 웹 로그 데이터 처리를 위한 스토리지의 유연한 확장이 어려워 졌으며, 장기간 축적되는 웹 로그 데이터를 분류, 분석처리 기능을 제공하는 시스템을 구현하기가 매우 어려워졌다.
이에 최근 대용량 데이터를 처리하는데, 각광을 받고 있는 분산처리 시스템 하둡을 적용하여 효율적인 대용량 웹 로그를 분석 방안을 제시하고자 한다. 하둡은 안정적인 공유 저장소 HDFS와 분석 시스템인 맵리듀스를 제공한다.
본 논문에서는 하둡을 사용하여 효과적인 웹 로그 수집 방법과 웹 로그 레별 별로 발생되는 웹 로그에 형태를 확인하고 이에 맞는 분석 기법 및 하둡의 구성 설계를 제안한다.
본 연구를 통해 대용량의 웹 로그 데이터 처리에 대한 어려움을 해결하고, 웹 로그 분석을 통해 사용자의 활동 패턴을 제시함으로써 새로운 마케팅 수단으로 활용 될 수 있다는 장점을 제시한다.

목차

제 1 장 서론 1
1.1 연구배경 및 목적 1
1.2 논문의 구성 3
제 2 장 관련연구 4
2.1 데이터 마이닝 4
2.1.1 데이터 마이닝 프로세스 4
2.1.2 데이터 마이닝 기법 6
2.2 웹 로그 데이터 분석 7
2.2.1 웹 로그 개념 7
2.2.2 웹 로그 분석의 활용 8
2.2.3 웹 로그 파일의 종류 9
2.2.4 웹 로그 추출 방법 12
2.3 웹 로그 데이터 분석의 기존연구 14
2.4 하둡 16
2.4.1 분산파일시스템 17
2.4.2 맵리듀스 20
2.4.3 하둡의 하부 프로젝트 21
제 3 장 하둡 웹 로그 분석 방법 24
3.1 기능 분석 24
3.2 웹 로그 분석을 위한 하둡 구성 설계 25
3.2.1 웹 로그 분석 시스템 흐름 25
3.2.2 웹 로그 분석 시스템 27
3.3 웹 로그 분석 시스템 모듈 구성 29
3.3.1 웹 로그 수집/적재 모듈 구성 29
3.3.2 웹 로그 분석 모듈 구성 34
3.3.3 웹 로그 분석 결과 처리 모듈 구성 36
3.3.4 웹 로그 분석 스케줄 모듈 구성 37
제 4 장 웹 로그 분석 수행 38
4.1 웹 로그 분석 데이터 38
4.2 웹 로그 분석 환경 구축 38
4.3 웹 로그 분석 40
4.4 시스템의 평가 46
제 5 장 결론 및 향후 연구과제 48
참고문헌 50

최근 본 자료

전체보기

댓글(0)

0