도심지를 중심으로 지반함몰이 빈번하게 발생하고 있으며, 지반함몰 발생 시 사회적, 물질적인 많은 피해를 야기하기 때문에 이에 대한 사전관리 및 예방이 필요하다. 지반함몰 발생의 주요원인으로는 하수관 손상으로 인한 주변 지반의 이완 및 공동의 발생으로 알려져 있으며, 이외 상수관의 손상, 굴착공사 등 복합적인 원인으로 지반함몰이 발생하는 것으로 보고되었다. 이와 같이 최근 복합적인 원인에 의해 발생하는 지반함몰의 예측에 관한 연구는 다양한 기법을 활용해 수행되고 있다. 본 연구에서는 ○○시의 하수관 특성과 지반함몰 발생 위치 데이터로 구축된 데이터셋으로 기계학습을 통한 하수관 특성에 따른 지반함몰 발생 분류 모델을 제시하고자 하였으며, 지반함몰에 영향을 미치는 하수관 특성별 중요도를 산정하고자 하였다. 이를 위하여, ○○시에 기록된 하수관 특성 데이터와 지반함몰 발생 위치 데이터를 ArcGIS의 Near Tool 패키지를 활용하여 지반함몰 발생 위치에서 가장 근접한 하수관의 데이터와 결합하는 방법으로 데이터셋을 구축하였다. 구축된 데이터셋을 통해 ○○시의 지반함몰 발생 빈도를 분석하였으며, 기계학습 기법 중 분류 문제의 학습모델인 KNN, 로지스틱 회귀분석, 의사결정나무, 랜덤포레스트, Ada Boost, XG Boost, LightGBM, 나이브 베이즈, SVC 모델에 적용하여 평가 지표를 비교해 적절한 모델을 선정하였으며, 지반함몰에 영향을 미치는 하수관 특성의 중요도를 도출하였다. 또한, 적합한 모델을 선정하여 ○○시의 ○○구 데이터셋에 적용함으로서, 해당 모델의 적용성을 검증하였고 적용 대상지역의 시간의 흐름에 따른 지반함몰 발생 추정 변화율을 분석하였다. 지반함몰 발생 영향인자를 통계 분석한 결과, ○○시의 전체 지반함몰 발생원인은 약 90%가 하수관의 손상으로 나타났으며, 대다수의 하수관의 종류는 HP관으로 나타났다. 또한, 매설 년수가 40년 이상된 노후관과 경사도는 0.01이하의 관에서 지반함몰 발생 빈도가 높게 도출되었다. 또한 기계학습을 활용하여 지반함몰 분류에 적합한 모델을 찾아내고 영향 인자의 중요도를 확인하기 위하여 데이터셋을 기계학습에 적용한 결과, 랜덤 포레스트와 LightGBM의 모델의 성능평가 지표인 재현율(Recall)과 AUC가 우수하게 나타났으며, 이를 통하여 지반함몰에 영향을 미치는 하수관 특성의 중요도는 매설 년수, 경사도, 평균 심도, 관의 길이, 관의 직경 순으로 나타났다. 또한, 우수한 지표를 나타낸 모델을 ○○시의 ○○구의 데이터셋에 적용한 결과, LightGBM 모델의 적용성이 보다 우수하였으며, 이를 통한 ○○구의 시간경과에 따른 지반함몰 발생 개수를 추정한 결과, 현재로부터 15년이 경과한 이후 지반함몰 발생 비율이 급격히 증가하는 것으로 나타났다. 본 연구에서 도출된 결과를 바탕으로 지반함몰 발생의 예방을 위한 조치 시 우선순위를 결정에 참고 자료로 활용될 수 있을 것으로 기대되며, 추후 주변 지반의 정보 및 지하 구조물의 정보 등을 취합하여 종합적인 지반함몰 발생 예측 모델의 기초자료로 활용될 것으로 판단된다.
Ground Subsidence occurs frequently in downtown areas and it causes a lot of social and material damage, so it is necessary to manage and prevent it in advance. The main cause of ground subsidence is known to be the relaxation of the surrounding ground and the occurrence of cavities due to damaged sewage pipes and it has also reported to be caused due to complex reasons such as water pipes damage and excavation work. Thus, recent studies on the prediction of ground subsidence caused by complex reasons are being conducted using various techniques. In this study, we present a classification model for the occurrence of ground subsidence according to the characteristics of sewage pipes through machine learning with a dataset constructed with data on the characteristics of the sewage pipe in ○○city and the location of the occurrence of the ground subsidence. We also tried to assess the importance of each sewage pipe characteristic affecting the ground subsidence. For this, a dataset was constructed by combining the sewage pipe characteristic data and ground subsidence location data recorded at ○○ city with the data of the sewage pipe closest to sink hole location using ArcGIS''s Near Tool package. The frequency of occurrence of ground subsidence in ○○ city was analyzed through the constructed dataset. An appropriate model was selected by comparing evaluation indicators by KNN, Logistic Regression analysis, Decision Tree, Random Forest, Ada Boost, XG Boost, LightGBM, Naive Bayes and SVC models, applying learning model for classification problems among the machine learning methods, and the importance of sewage pipe characteristics affecting ground subsidence was derived. In addition, the applicability of the model was verified by selecting a suitable model and applying it to the ○○-gu, ○○ city data set, and estimated change rate of the occurrence of ground subsidence was analyzed that the according to the passage of time in the applied area. As a result of statistical analysis of the factors affecting the occurrence of ground subsidence, it was found that about 90% of the causes of ground subsidence in ○○ city were damage to sewage pipes, and the majority of the types of sewage pipes were HP pipes. Furthermore, the frequency of ground subsidence was found to be high in pipes with a slope of 0.01 or less for aged pipes that were buried for more than 40 years. In addition, Recall and AUC, the performance evaluation indicators of the Random Forest and LightGBM models, were found to be excellent as a result of applying the dataset to machine learning to find a model suitable for ground subsidence classification using machine learning and check the importance of the influencing factors. Through this, the importance of the characteristics of the sewage pipe affecting the ground subsidence was shown in the order of the number of years of burial, the slope, the average depth, the length of the pipe, and the diameter of the pipe. And the applicability of the LightGBM model was better as a result of applying the model showing excellent indicators to the dataset of ○○-gu, ○○ city. Based on it, it was found that the rate of ground subsidence increased rapidly after 15 years as a result of estimating the number of ground subsidence in ○○-gu. Based on the results derived from this study, it is expected to be used as a reference data for prioritizing measures to prevent ground subsidence and also expected to be used as basic data for a comprehensive ground subsidence prediction model by collecting the information on the surrounding ground and underground structures, etc.
목 차 ⅰ표 목 차 ⅳ그 림 목 차 ⅵ<초 록> ⅷⅠ. 서 론 11. 연구 배경 및 목적 12. 국내·외 연구동향 3가. 국내 연구 동향 3나. 국외 연구 동향 53. 연구 내용 및 방법 74. 논문의 구성 8Ⅱ. 이론적 배경 101. 지반함몰 10가. 개요 10나. 지반함몰의 원인 12다. 지반함몰 발생 추이 13라. 지하공동 탐사법 202. 기계학습 22가. 기계학습의 과정 23나. 기계학습의 종류 25다. 기계학습의 패키지 27라. 기계학습 모델 이론 30마. 기계학습 모델 평가방법 42Ⅲ. 하수관 특성에 따른 지반함몰 발생 데이터 처리 471. 연구 대상지역 472. 수집 데이터 특성 47가. 하수관 특성 데이터 47나. 지반함몰 발생 데이터 503. 데이터셋의 구축 504. 데이터의 특징 51가. 데이터셋의 개수 51나. 불균형 데이터 525. 하수관 특성 데이터의 분포 53가. 데이터 기술통계량 53나. 데이터 분포도 556. 데이터의 상관분석 587. 데이터의 빈도분석 59가. 지반함몰 발생원인 빈도분석 59나. 관 종류에 따른 지반함몰 발생 빈도분석 61다. 매설 년수에 따른 지반함몰 발생 빈도분석 62라. 관 직경에 따른 지반함몰 발생 빈도분석 64마. 관 길이에 따른 지반함몰 발생 빈도분석 65바. 평균 심도에 따른 지반함몰 발생 빈도분석 67사. 경사도에 따른 지반함몰 발생 빈도분석 68Ⅳ. 하수관 특성에 따른 지반함몰 발생 예측 모델 701. 기계학습을 위한 데이터셋 712. 기계학습을 위한 데이터의 전처리 72가. 데이터의 제거 및 Scaling 72나. 데이터 Sampling 733. 기계학습을 활용한 모델 훈련 74가. KNN 75나. 로지스틱 회귀분석 78다. 의사결정나무 81라. 랜덤 포레스트 84마. 부스트 87바. SVM 93사. 나이브 베이즈 954. 기계학습을 활용한 모델 훈련결과 비교 97Ⅴ. 하수관 특성에 따른 지반함몰 예측 모델의 적용 1021. ○○구 데이터의 특성 1022. 기기계학습 모델의 적용 104가. 랜덤 포레스트 104나. LightGBM 1063. 기계학습 모델의 적용평가 1074. 기계학습 모델을 통한 지반함몰 발생 추정 108가. 시간 경과에 따른 지반함몰 발생 추정 109나. 관의 직경에 따른 지반함몰 발생 추정 110Ⅵ. 결론 112참 고 문 헌 115ABSTRACT 127