공동주택의 주종을 이루고 있는 건축물인 아파트는 지속적인 수선유지관리를 통하여 건축물의 노후화를 방지하고 건축물의 사용 연한을 늘리는데 기여를 한다. 이에 따라서 공동주택의 관리주체는 관련법에 따라 일정금액을 적립하여 수선주기에 따라 보수를 시행하고 있으나 이는 공용부에 한정되어 있고, 실제로 사람이 거주하는 주요공간인 전용부는 점유하고 있은 개인이 보수 책임을 지고 있으므로 유지관리 여부를 가늠하기가 어렵다. 따라서 세대 전용부 수선유지보수 이력이 있는 임대주택의 데이터를 분석하여 세대 전용부 시설물은 어떻게 유지관리를 추정하고, 세대 전용부 수선유지보수 이력에 대한 데이터를 분석하여 어떠한 유지보수 연관성이 있는지 분석하는 것이 본 연구의 목적이다.
데이터선정을 위하여 서울 노원구 소재 임대아파트 5개단지 8,005세대의 3년간 전용부 시설물 보수이력 18,192건을 서울주택도시공사 시설물관리시스템에서 추출하였고, 단독항목, 필요 없는 단어, 전용부 이외의 항목, 필요 없는 항목을 데이터 Pre-processing 하였다. 데이터 분석에는 오픈소스 프로그램인 “R”을 사용하였고 세부적인 데이터 정리를 위하여 프로그램 패키지인 Dplyr으로 자료정리 및 합치는데 사용하고 Konlp패키지로 한글을 분석하고 Aruies으로 단어 간의 연관규칙을 분석하였다. 분석에 사용된 수학적 알고리즘 Apriori으로 지지도(Support), 신뢰도(Confidence), 향상도(Lift)를 추출하여 시설물 보수이력에 대한 텍스트 마이닝 기법을 통하여 데이터 분석을 하였다. 지지도(Support)는 데이터의 빈발성 확인, 신뢰도(Confidence)는 데이터가 다른 데이터에 미치는 영향을, 향상도(Lift)는 데이터의 연관관계를 알 수 있도록 수치로서 나타낸다.
텍스트 마이닝 결과 누구나 충분히 예상 할 수 있는 단어의 집합이 향상도가 높으므로 연관성이 가장 많은 관계를 가지고 있다는 것을 알 수 있었고, 지지도를 통하여 단어 및 단어조합의 빈발성을 확인할 수 있었다. 지지도가 높음에 따라서 빈발도가 높은 중요한 항목이 증명되고 신뢰도에 영향을 주어 신뢰도의 수치에 따라 어떤 단어가 다른 단어에 영향을 미치는 가를 확인 할 수 있었다. 따라서 이번 연구에서 Apriori를 이용한 텍스트 마이닝 분석의 정확도와 신뢰성이 검증되었다.
Analysing the Maintenance History of Apartment Using Text Mining
Lee, Jun Beom (Supervisor Kim, Sean Hay) Dept. Built Environment and Building Service Engineering Graduate School of Housing and Urban Planing Seoul National University of Science and Technology
Apartment, the main building of an apartment building, contributes to preventing aging of buildings and increasing the number of years of use of buildings through constant maintenance and maintenance. Accordingly, the managing body of an apartment is required to set aside a certain amount for repairs according to the relevant law, but this is limited to the public sector and the private sector, which is a major space where people reside, is held, so it is difficult to assess whether the apartment is maintained. Therefore, the purpose of this study is to analyze the data of rental housing with repair and maintenance history of the household only, to estimate maintenance of the household unit, and to analyze the maintenance relation by analyzing the data on the repair and maintenance history of the household dedicated to the household.
In order to select data, 18,192 cases of facility maintenance records were extracted from the Seoul Housing Corporation facility management system for the three-year period of 8,005 households in five rental apartments in Nowon-gu, Seoul, and data pre-processed items other than the exclusive, unnecessary, and unnecessary items. For data analysis, the open source program "R" was used to organize and combine data with the program package Dplyr for detailed data reduction, and to analyze the related rules of the words with the Konlpackage. Data were analyzed through text mining techniques for facility repair history by extracting support, reliability, and lift with the mathematical algorithm Apriori used in the analysis. Support represents the impact of data on other data and the degree of improvement in data correlation as a number.
Text mining shows that the most relevant relationships are the result of the high degree of improvement in the well-anticipated set of words, and the frequency of the words and combination of words was identified through the support level. As the support level was high, important items with high frequency were demonstrated and reliability was affected so that it was possible to determine which words affected other words depending on the level of confidence. Therefore, the accuracy and reliability of text mining analysis using Apriori were verified in this study.
목 차요약 ⅰ표목차 ⅱ그림목차 ⅲI. 서 론 11.연구의 배경 및 목적 1II. 데이터분석기술(Text Mining) 21. 데이터 마이닝(Data Mining) 22. 텍스트 마이닝(Text Mining) 3III. 텍스트 마이닝 알고리즘(A Priori Algorithm) 51. A Priori Algorithm 52. 연관성 측정지표 6IV. 데이터 수집 및 분석 91. 데이터선정 92. 데이터 Pre-Processing 103. 분석프로그램“R” 124. 작업순서도 135. A Priori 분석결과 206. 검증 33V. 결 론 34참고문헌 36영문초록(Abstract) 37감사의글 39