관심 지점(POI)란 사용자가 필요로 하는 유용한 정보를 나타내는, 현실 세계 또는 지도나 도면상의 특정한 지리적 위치를 말한다. 본 연구에서의 POI는 국가 관심 지점 정보로 한한다. 국가 관심 지점은 공공기관이 보유한 지형지물의 위치정보가 반영된 명칭을 의미한다. POI는 구축 과정에 현장조사를 통한 데이터 취득이 포함되어 시간과 비용이 소요되는 문제점이 존재한다. 또한 공공과 민간의 정보 갱신 주기의 차이로 데이터를 통합하는 데 지도로 구현된 데이터의 시간 정확성이 미흡하다. 마지막으로 위치 정보 제공의 바탕이 되는 시설물에 대하여 공공과 민간의 유지 관리 비용의 중복 투입과 위치 정보 유지 관리의 한계점이 존재한다. 따라서 본 연구는 POI의 구축 과정에서 발생하는 시간과 비용의 한계점을 보완하기 위해 대표적인 위치 기반 소셜 네트워크인 포스퀘어(FourSqaure) 데이터를 활용하여 POI를 구축할 수 있는 모델을 개발하고 포스퀘어 데이터가 사업체의 공간 분포 특성 파악에도 활용될 수 있는 가능성을 제시하고자 한다. 이를 위하여 위치 기반 소셜 네트워크 데이터와 국가 관심 지점 데이터를 수집하고 전처리하여 두 데이터 간 명칭쌍을 생성하고 레벤슈타인 거리를 계산하여 새로운 POI를 구축한다.
서울시 종로구 세종로 테스트를 데이터로 모델을 개발한 후 종로구 데이터를 모델에 적용한 결과 종로구 전체 POI 데이터 26,609건이 추출되었고 포스퀘어 데이터 23,832건이 추가되었다. 새로 구축된 데이터는 총 50,345건으로 기존 POI 데이터에 47.14%가 추가되었다. 모델 구축 시와 마찬가지로 대부분의 포스퀘어 데이터가 추가되었는데 이는 포스퀘어 데이터는 사용자가 직접 데이터를 생성한 것이지만 본 연구의 기존 POI는 국가 관심 지점으로 공공기관이 보유한 주요 지형지물의 위치정보를 나타내고 있기 때문으로 판단하였다. 구축된 모델을 평가하기 위해 ISO에서 제시한 지리 정보 데이터 품질 중 위치 정확도, 시간 정확도, 주제 정확도와 POI 구축 시 한계로 제시된 시간과 비용 측면을 고려하였다. 구글 지오코딩 API로 위치 정확도를 평가한 결과 모델의 위치 정확도는 유의미하다고 판단하였다. 반면 기존 POI와 새로운 POI로 구축된 포스퀘어 데이터 간 시간이 일관적이지 않아 시간 정확도 측면은 유의미하지 않았다. 또한 주제 정확도는 기존 POI의 카테고리 범주에 따라 어느 정도 유의미하다고 볼 수 있다고 판단하였다. 마지막으로 개발된 모델을 통해 시간과 비용을 크게 절감할 수 있다. 평가에 더하여 구축된 POI 데이터의 카테고리의 분포 특성을 파악하여 서울시 상업공간의 분포와 비교함으로써 포스퀘어 데이터가 POI 구축 뿐 아니라 사업체의 공간 분포 분석에 있어 효용성을 제시하고자 하였다. 이를 위하여 기존 POI 데이터, 새로 POI로 구축된 포스퀘어 데이터, 서울시 사업체 현황 통계들 간의 유사한 카테고리를 추출하고 이들 간의 상관계수를 측정하여 가장 상관도가 높은 ‘음식점’ 카테고리를 추출하였다. ‘음식점’ 카테고리의 공간 분석을 통해 POI로 구축된 포스퀘어 데이터 카테고리는 다음과 같은 의미를 지닌다. 첫째, 사업체의 공간적 특성을 파악할 수 있다. 둘째, 사업체의 공간적 특성 분포는 효과적으로 표현되지 않았던 사업체의 특성이 포스퀘어 데이터가 추가된 후 가시적으로 표현될 수 있었다. 본 연구는 위치 기반 소셜 네트워크 서비스가 POI 구축 시 제시되는 한계점을 보완할 수 있다는 것을 POI 구축 모델 개발을 통해 입증하였다. 특히 본 연구의 모델은 시간과 비용을 크게 절감할 수 있음을 보여주었다. 또한 기존의 POI 검색 알고리즘과 POI 추천 등의 방법론적인 연구들과는 달리 POI 구축 모델 개발을 넘어 속성 정보를 분석하여 지역별 상업 공간 분포가 어떤 차이가 있는지 지리적인 측면에서 분석하였다. 본 연구는 기존 연구와 달리 지리적인 요소가 반영되어 있는 POI와 위치 기반 소셜 네트워크의 공간 정보 융합 방법을 제시하였다는 점에서 의의가 있다. 또한 위치 기반 소셜 네트워크가 POI 구축 뿐만 아니라 사업체의 공간 분포 특성의 효용성을 제시한다는 점에서 위치 기반 소셜 네트워크가 다방면으로 활용될 수 있을 것이라고 기대한다. 하지만 시간 정확도와 주제 정확도 측면을 보완하기 위한 후속 연구가 필요하다.
POI is a specific geographic location in the real world or on a map or drawing that represents useful information that a user needs. POI in this study is limited to information on points of national interest. A national point of interest means a name that reflects the location information of a topographical feature owned by a public institution. POI has a problem in that it takes time and money because data acquisition through field investigation is included in the construction process. In addition, the time accuracy of the data implemented as a map is insufficient to integrate data due to the difference in the information update cycle between the public and private sectors. Lastly, for facilities that provide location information, there is a limit to the overlapping input of public and private maintenance costs and location information maintenance. Therefore, this study develops a model that can build a POI using FourSquare data, a representative location-based social network, to compensate for the time and cost limitations that occur in the POI construction process, and the FourSquare data identifies spatial distribution characteristics of businesses We would like to suggest the possibility that it can also be used. For this purpose, location-based social network data and national point of interest data are collected and preprocessed to generate a name pair between the two data, and a new POI is constructed by calculating the Levenshtein distance. After developing a model using the Sejong-ro test data in Jongno-gu, Seoul, and applying the Jongno-gu data to the model, 26,609 total POI data in Jongno-gu were extracted, and 23,832 Foursquare data were added. The newly constructed data totaled 50,345, and 47.14% was added to the existing POI data. As in the model building, most of the Foursquare data was added because the POSCare data was generated by the user, but the existing POI in this study is a point of national interest and indicates the location information of major geographical features owned by public institutions. To evaluate the built model, location accuracy, time accuracy, topic accuracy, and time and cost aspects presented as limitations in POI construction were considered among the geospatial data quality presented by ISO. As a result of evaluating the location accuracy with Google Geocoding API, it was determined that the location accuracy of the model was significant. On the other hand, the time accuracy aspect was not significant because the time between the foursquare data constructed with the existing POI and the new POI was not consistent. In addition, it was judged that the subject accuracy could be considered to be significant to some extent depending on the category category of the existing POI. Finally, the developed model can significantly save time and money. In addition to the evaluation, by identifying the distribution characteristics of the categories of the constructed POI data and comparing them with the distribution of commercial spaces in Seoul, Foursquare Data was intended to suggest the utility of not only POI construction but also spatial distribution analysis of businesses. For this purpose, similar categories were extracted between existing POI data, newly constructed Foursquare data, and statistics on the status of businesses in Seoul, and the correlation coefficient between them was measured to extract the ‘restaurant’ category with the highest correlation. The Foursquare data category built with POI through spatial analysis of the ‘restaurant’ category has the following meanings. First, the spatial characteristics of the business can be grasped. Second, the distribution of spatial characteristics of a business could be expressed visually after the foursquare data was added to the characteristics of a business that were not effectively expressed. This study proved that location-based social network services can supplement the limitations presented in POI construction through POI construction model development. In particular, the model of this study showed that time and cost can be greatly saved. In addition, unlike methodological studies such as POI search algorithms and POI recommendations, property information beyond the development of a POI construction model in this study was analyzed to examine the differences in the distribution of commercial spaces by region from a geographical point of view. Unlike previous studies, this study is meaningful in that it presents a method of convergence of spatial information between POI and location-based social networks that reflect geographic factors. In addition, it is expected that location-based social networks can be utilized in various fields in that location-based social networks not only build POIs but also present the utility of spatial distribution characteristics of businesses. However, further studies are needed to complement the temporal accuracy and subject accuracy aspects.
차 례표 차례 ⅰ그림 차례 ⅱ국문 요약 ⅲ1. 서론 11) 연구 배경 및 목적 12) 연구 내용 및 방법 43) 논문의 구성 52. 문헌 연구 81) 주요 용어 8(1) 공간정보 빅 데이터 8(2) 사회 관계망 서비스 9(3) 포스퀘어 11(4) 관심 지점 152) 선행연구 검토 23(1) SNS를 활용한 공간정보 빅 데이터 분석 연구 동향 23(2) POI를 주제로 한 연구 동향 253) 소결 313. POI 구축 모델 개발 321) 개발 방법 32(1) 알고리즘 32(2) 레벤슈타인 거리 342) 모델 개발 37(1) 데이터 수집 및 전처리 37(2) 명칭쌍 생성 38(3) 레벤슈타인 거리 계산 40(4) POI 구축 413) 소결 444. POI 구축 모델 적용 및 평가 461) 모델 적용 및 평가 462) 카테고리 분석 513) 소결 585. 결론 60참고문헌 62ABSTRACT 66부록 70