메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

임어진 (이화여자대학교, 이화여자대학교 대학원)

지도교수
용환승
발행연도
2019
저작권
이화여자대학교 논문은 저작권에 의해 보호받습니다.

이용수3

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
기존의 추천 시스템은 사용자와 상품이라는 두 가지의 요소와 그에 따른 평점 값으로 이루어진 2차원 행렬 데이터를 기반으로 하여 추천을 하는 기법을 사용해왔다. 그러나 실제 상황에서는 고객이 물건을 구매할 때, 상품 자체만을 보고 구매하는 경우 외에도 다른 여러 가지 사항을 고려하여 구매에 이르는 경우가 많다. 그런 점에서 2차원 행렬 데이터를 이용한 추천 시스템은 사용자와 상품 외에 다른 여러 가지 고려 사항을 반영하지 못한다는 한계가 있기 때문에 최근에는 사용자와 상품 외에 추가적인 요소를 더하여 세 가지 이상의 항목을 고려하는 추천 시스템에 대한 연구가 활발히 이루어지고 있다. 이러한 세 가지 이상의 항목이 있는 다차원의 배열을 텐서(Tensor)라고 하며, 고차원의 텐서 데이터를 분해하는 알고리즘을 이용한 연구가 데이터 마이닝(Data Mining), 컴퓨터 비전, 선형 대수학 등 여러 분야에 활용되고 있는 추세이다.
텐서 데이터의 주된 문제점은 데이터 상당 부분의 값이 결측되었다는 희소성(Sparsity)의 문제가 있다. 이를 해결하기 위해 고차원의 텐서를 보다 낮은 차원의 배열로 변환 혹은 축소하는 텐서 분해 기법을 이용하여 텐서를 분해하고 분해된 결과를 통해 다시 재구성함으로써 본래에 비어있던 값을 계산된 값으로 복구하는 방식으로 텐서를 완성하는 기법(Tensor Completion)이 사용된다.
그리하여 본 논문에서는 드롭아웃(Dropout)기법에서 고안한 정규화 알고리즘을 통해 텐서를 정규화하고 정규화된 텐서를 분해하고 재구성하는 과정을 거쳐, 비어있는 요소가 없는 완성된 텐서를 이용하여 사용자 기반의 상위 K개의 추천 목록을 제공하는 시스템을 제안하며, 실제 데이터를 이용하여 인 메모리 빅데이터 시스템인 아파치 스파크(Apache Spark)를 기반으로 많은 양의 데이터 처리를 빠른 시간 내에 가능하도록 하였으며 정규화하지 않은 데이터와의 성능 비교를 통해 정규화 알고리즘을 적용한 추천 시스템이 더 향상된 추천 성능을 보임을 확인하였다.

목차

Ⅰ. 서론 1
A. 연구 배경 및 내용 1
B. 논문 구성 3
Ⅱ. 관련 기술 및 연구 동향 4
A. PARAFAC 분해 알고리즘 4
B. 텐서 재구성 7
C. 텐서 기반 추천 시스템 연구 동향 8
D. 데이터 정규화 10
Ⅲ. 텐서 재구성을 이용한 추천 시스템 12
A. 정규화 알고리즘 12
B. 정규화된 행렬 재구성을 이용한 추천 시스템 15
C. 텐서 재구성을 이용한 추천 시스템 16
Ⅳ. 실험 22
A. 실험 데이터 및 실험 환경 22
B. 평가 방법 24
C. 실험 결과 및 분석 25
Ⅴ. 결론 및 향후 연구 34
참고문헌 35
ABSTRACT 39

최근 본 자료

전체보기

댓글(0)

0