메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

임승준 (홍익대학교, 홍익대학교 대학원)

지도교수
류춘호
발행연도
2023
저작권
홍익대학교 논문은 저작권에 의해 보호받습니다.

이용수38

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (5)

초록· 키워드

오류제보하기
2022년 현재 국내 중고차 시장은 지속적으로 성장하고 있으며, 중고차 시장에서 온라인 중고차 플랫폼의 점유율은 50%에 가까워지고 있다. 온라인 중고차 플랫폼은 차량 제원에 그치지 않고 차량의 세부 옵션까지 공개함으로써 소비자들이 해당 차량의 정보를 손쉽게 확인할 수 있도록 하였다.
중고차 가격 예측의 기존 연구는 차량 제원을 활용한 연구가 대부분이었으며, 차량의 주행거리 및 사용기간과 중고차 가격 간 관계가 비선형의 모습으로 나타나는 경향이 존재하였다. 최근의 연구는 비선형관계를 해결하기 위해 다양한 머신러닝 모델을 활용하여 머신러닝 모델별 비용함수(Cost Function)를 비교하는 경우가 많았으며, 대부분의 연구 결과에서 분류형 머신러닝 모델인 랜덤 포레스트(Random Forest; RF) 모델의 우수성을 증명한 경우가 많았다. 변수와 결과값 간 비선형관계에서 분류형 머신러닝 모델은 결과값의 예측 오차율(MAPE)이 회귀형 머신러닝 모델에 비해 상대적으로 우수하나, 분류형 머신러닝 모델 간 변수의 영향력이 다르게 나타남과 동시에 영향력의 방향성을 알 수 없다는 단점이 존재했다. 반면 회귀형 머신러닝 모델은 변수의 영향력과 방향성 확인에 적합하나 변수와 결과값 간 비선형관계일 경우 결과값의 예측 오차율이 분류형 머신러닝 모델에 비해 상대적으로 떨어지는 단점이 존재했다. 이에 따라 본 연구는 회귀형과 분류형 머신러닝 모델을 차례대로 활용하여, 두 유형의 머신러닝 모델의 장점을 취합하고자 하였다.
본 연구는 중고차 온라인 플랫폼에서 크롤링(Crawling)과 스크래핑(Scraping)을 통해 차량 제원과 차량 옵션 자료를 수집하였고, 차량 제원의 일부 변수는 차량 제조사의 공식 카탈로그(Catalogue)를 활용하였다. 확보된 자료를 통해 라쏘(Lasso) 회귀형 머신러닝 모델을 활용하여 중고차 가격에 영향을 미치는 변수들의 영향력과 방향성을 확인하고, 영향력이 0인 변수들을 도출하였다. 다음으로 전체 변수를 활용한 분류형 머신러닝 모델과 영향력이 0인 변수를 제거한 분류형 머신러닝 모델 간 비용함수 수치를 비교하였다. 연구 결과 회귀형 머신러닝 모델을 통해 개별 브랜드와 전체자료에 대해 중고차 가격에 영향을 미치는 차량 제원 변수와 차량 옵션 변수를 확인하였다. 또한 전체 변수를 활용한 분류형 머신러닝 모델과 영향력이 0인 변수를 제거한 분류형 머신러닝 모델 간 비교를 통해 비용함수 수치의 큰 차이가 존재하지 않았다는 것을 확인하였다.
본 연구의 시사점은 다음과 같다. 첫째, 두 유형의 머신러닝 모델을 연속적으로 실행하여, 이들의 장점을 최대한 활용할 수 있는 발판을 마련했다고 판단된다. 둘째, 일부 브랜드와 전체자료에 대한 머신러닝 모델 간 비교를 통해 LGBR(Light Gradient Boosting Regression) 모델의 우수성을 확인하였다. 셋째, 개별 브랜드와 전체자료에서 차량 제원 변수와 차량 옵션 변수 중 어떤 세부 변수가 중고차 가격 예측에 영향을 미치는지, 이들 변수 간 영향력과 방향성을 확인하였다. 이를 통해 중고차 매매관계자들 간 정보의 불공평으로 인한 문제를 해결할 수 있는 하나의 방안이 될 것이라 사료 된다.
본 연구의 한계점은 다음과 같다. 우선 중고차 가격은 특성상 외부 요인에 따른 변동성이 존재한다. 이러한 중고차 가격의 변동성에 대응하기 위해서는 새로운 외부 요인(거시적 지표)을 추가하여 자료를 지속적으로 업데이트할 필요성이 있다. 다음으로 중고차 매매에서 가장 큰 문제는 정보의 불공평성으로 인해 중고차 매매자 간 신뢰수준이 낮은 것이다. 만약 차량 정보의 투명성이 확보되어 차량의 정비 및 사고 내역을 연구에 활용한다면 더욱 예측 정확도가 높은 머신러닝 모델의 구성이 가능할 것으로 예상된다. 마지막으로 본 연구는 중고차 가격을 예측하기 위해 하이퍼 파라미터 튜닝(Hyper Parameter Tuning)에 소모되는 시간을 고려하여 CRT(Classification Regression Tree), RFR, 그리고 LGBR 모델을 활용하였다. 그러나 추후 GBR(Gradient Boosting Regression) 모델과 XGBR(eXtra Gradient Boosting Regression) 모델을 추가하여 분류형 머신러닝 모델 간의 비교가 필요하다고 판단된다.

목차

1장. 서론 1
1. 연구의 배경 및 목적 1
2. 연구방법 및 구성 4
2장 선행 연구 및 이론적 배경 5
1. 중고차 시장 5
1) 중고차 시장의 현황 5
2) 중고차 가격에 관한 연구 7
2. 머신러닝 9
1) 머신러닝의 정의와 종류 9
2) 머신러닝 모델을 활용한 중고차 가격 예측에 관한 연구 11
3장. 자료 수집과 변수설정 16
1. 자료 수집 16
2. 변수의 조작적 정의와 측정 방법 21
1) 차량 제원 22
2) 차량 옵션 24
3. 표본 특성 25
4장. 연구 모형 28
1. 머신러닝(Machine Learning) 32
1) 머신러닝의 종류 32
2) 라쏘(Lasso) 회귀 모델 33
3) CRT(Classification and Regression Tree) 모델 34
2. 머신러닝 모델별 최적 모델의 실행 과정 37
1) 과대적합과 과소적합(Overfitting & Underfitting) 37
2) K-Fold 교차검증(K-Fold Cross Validation) 38
3) 머신러닝의 하이퍼 파라미터 튜닝(Hyper Parameter Tuning) 39
3. 비용함수(Cost Function)와 R^2 41
1) MSE(Mean Squared Error) 41
2) RMSE(Root Mean Squared Error) 41
3) MAE(Mean Absolute Error) 42
4) MAPE(Mean Absolute Percentage Error) 42
5) R^2 43
5장. 연구 결과 44
1. 브랜드별 머신러닝 모델 간 비교 44
1) 기아 45
2) 르노 54
3) 쉐보레 63
4) 쌍용 72
5) 제네시스 81
6) 현대 90
2. 전체자료의 머신러닝 모델 간 비교 99
1) 전체자료 99
2) 브랜드별과 전체자료의 최우수 분류형 머신러닝 모델 결과 110
6장 결론 112
1. 연구 결과의 요약 112
2. 연구의 의의 116
3. 연구의 한계점 117
참고문헌 119
영문초록 123

최근 본 자료

전체보기

댓글(0)

0