메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

조승환 (한양대학교, 한양대학교 대학원)

지도교수
김영민
발행연도
2023
저작권
한양대학교 논문은 저작권에 의해 보호받습니다.

이용수16

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
인터넷과 전자 매체의 발달로 사람들의 웹 사이트 접근 방식은 쉬워졌고, 이용량도 증가하였다. 웹 사이트의 이용량이 증가함에 따라, 이용자들이 웹 사이트에 요구하는 것들도 다양해졌다. 이러한 요구를 충족시키기 위한 여러 연구가 진행되었으며, 이용자들의 요구를 받아들이기 위한 설문조사나 리뷰 등과 같은 시스템이 도입되었다. 특히 여러 연구 중 이용자들에게 어떠한 추가 정보를 요구하지 않는 웹 로그를 이용하여, 로그 데이터를 분석하는 다양한 연구들이 진행되었다.

로그 데이터란 웹 사이트 상의 이용자들이 활동하는 과정에서 생기는 정보의 형태를 저장한 것이다. 로그 데이터에는 이용자의 IP 주소, 방문 정보 등이 남아있다. 이러한 데이터를 분석하여 웹 사이트의 이용자들에 대한 특징을 알아낼 수 있고, 이를 바탕으로 이용자들의 요구에 맞는 정보를 제공할 수 있다. 로그 데이터 분석은 이윤 창출할 수 있는 서비스에서 활발하게 진행되었으나, 공익을 목적으로 하는 학술 콘텐츠 서비스에서는 상대적으로 많이 진행되지 않았다. 따라서 학술 콘텐츠를 다루는 웹사이트의 로그 데이터 분석을 통해, 이용자들에게 적합한 학술 콘텐츠를 제공할 수 있는 서비스가 필요하다.

본 논문에서는 이러한 필요성에 따라, 이용자에게 필요한 학술 지식을 제공하는 과학기술 지식 인프라 서비스인 ScienceON의 로그 데이터를 분석한다. 분석을 통해 이용자들의 행동 패턴을 파악하고, 신규 이용자들에게 필요한 정보를 제공하는 방법론을 제안한다. 이용자들의 행동 패턴을 파악하기 위해, 로그 데이터를 정제하여 이용자들의 행동을 파악할 수 있도록 세션 분리를 진행하고, 분리된 세션을 묶어 이용자의 패턴을 생성한다. 생성된 패턴에 대한 탐색적 분석을 통해 대략 아홉 개의 대표 패턴을 얻을 수 있었다. 이러한 결과에 따라 아홉 개의 군집에 대한 K-modes 클러스터링을 진행하여 각 군집을 대표하는 이용자의 패턴을 찾을 수 있었고, 신규 이용자의 행동 정보를 가지고 각 군집에 성공적으로 분류할 수 있었다.

본 논문에서 제안하는 방법론은 다음과 같다. ScienceON의 로그 데이터를 파악하고, 파악한 정보들을 바탕으로 데이터 분석에 불필요한 데이터를 제거한다. 이용자의 행동 정보를 얻기 위해 처리한 데이터에 대한 동일인 판단과 세션 분리를 진행한다. 클러스터링 분석을 하기 위해 이용자의 행동 정보와 관련된 속성들의 값을 정규화하여, 분리한 세션을 기준으로 묶어 이용자 행동 패턴을 생성하고 군집의 수를 정하기 위해 탐색적 분석을 한다. 탐색적 분석을 통해 얻은 군집의 수를 가지고 클러스터링을 진행하여 각 군집을 대표하는 이용자의 행동 패턴을 도출한다. 비로그인 이용자들을 신규 이용자라고 가정하고, 도출한 각 군집의 이용자 데이터와 신규 이용자 데이터를 매핑하여, 기존 이용자와 동일하게 행동한 신규 이용자를 해당 군집에 분류할 수 있도록 한다.

목차

제 1장 서론 1
1.1 연구의 목적 및 필요성 1
제 2장 이론적 배경 및 관련 연구 5
2.1 ScienceON 5
2.2 로그 데이터 6
2.3 행동 패턴 분석 9
2.4 클러스터링 11
2.5 이용자 행동 패턴 분석의 관련 연구 16
제 3장 제안된 방법론 21
3.1 데이터 수집 및 확인 22
3.2 데이터 전처리 24
3.2.1 이용자 로그인 데이터 전처리 25
3.2.2 이용자 비로그인 데이터 전처리 35
3.3 동일인 판단 및 세션 분리 39
3.3.1 동일인 판단 40
3.3.2 세션 분리 44
3.4 행동의 정규화 52
3.5 이용자 행동 패턴 클러스터링 56
3.6 이용자 행동 패턴 분류 63
제 4장 결과 분석 68
4.1 클러스터링 결과 분석 68
4.2 분류 결과 82
제 5장 결론 87
참고문헌 90
ABSTRACT 93

최근 본 자료

전체보기

댓글(0)

0