우리나라는 빅데이터를 정부 3.0 국정과제로 선정하여 다양한 분야에 적용 및 활용하고 있다. 그러나 빅데이터 관련 법규정이 불명확하고 빅데이터에 관한 이해, 분석기술, 전문성 등이 부족하여 빅데이터를 제대로 활용하지 못하고 있다. 그리고 빅데이터에 관한 선행연구는 대부분 공공부문보다는 민간부문을 대상으로 이루어졌으며 실증적으로 접근한 연구는 미흡하다. 따라서 본 연구는 빅데이터 활용에 영향을 미치는 요인을 밝혀내는 것을 연구목적으로 설정하였다. 연구목적을 달성하기 위해 빅데이터에 관한 이론적 배경 및 논의를 검토하여 빅데이터 활용의 영향요인을 도출하였다. 도출된 요인은 설문조사와 인터뷰 조사를 통해 실증적으로 분석하였으며, 이를 바탕으로 빅데이터 활용의 영향요인에 대한 가설을 검증하고 정책적 함의를 제시하였다. 본 연구의 설문조사는 서울시 공무원을 대상으로 실시하였으며, 분석에 사용한 설문지는 총 510부이다. 또한 인터뷰 조사는 빅데이터 전문가를 대상으로 실시하였다. 설문조사와 인터뷰 조사의 결과를 정리하면 다음과 같다. 주요 변수들의 평균값(개인/부서)을 기준으로 살펴보면, 종속변수인 빅데이터 활용의 전체 평균은 3.07/3.06으로 나타났으며, 세부지표인 빅데이터 활용정도는 2.83/2.83, 빅데이터 활용의지는 3.31/3.26으로 나타났다. 인터뷰 결과, 현재 공공데이터를 적극적으로 개방하고 있지만 유용한 데이터를 개방하지 않아 빅데이터 활용도가 낮다는 의견이 있었다. 독립변수인 법제도 요인의 전체 평균은 2.90/2.97로 나타났으며, 세부지표인 법적 이해도는 2.74/2.84, 법적 명확성은 2.81/2.86, 정보보호는 3.09/3.17, 보안체계는 2.99/3.02로 나타났다. 인터뷰 결과, 보안체계를 구축하여 운영절차에 맞게 잘 관리하고 있다는 의견을 보이고 있어 설문조사결과와 상충된 결과가 나타났다. 기술 요인의 전체 평균은 3.06/2.78로 나타났으며, 세부지표인 기술 개발은 3.46/2.71, 표준화는 2.86/2.79, 네트워크는 2.89/2.86으로 나타났다. 인터뷰 결과, 우리나라는 IT강국으로 인정받고 있고 현재까지 큰 문제없이 안정적인 네트워크를 유지하고 있다는 의견을 보이고 있어 네트워크의 평균값과 차이가 나타났다. 데이터 요인의 전체 평균은 3.27/3.29로 나타났으며, 세부지표인 정확성은 3.17/3.24, 객관성은 3.36/3.36, 신뢰성은 3.37/3.33, 데이터 관리는 3.20/3.26으로 나타났다. 인터뷰 결과, 데이터가 실시간으로 업데이트되지 않아 데이터를 체계적으로 관리하는데 어려움이 있다는 의견이 있었다. 매개변수인 행태 요인의 전체 평균은 2.90/2.89로 나타났으며, 세부지표인 빅데이터 인지도는 2.90/2.89, 개방적 태도는 2.95/3.02, 협력은 2.84/2.89, 전문성은 2.64/2.74로 나타났다. 인터뷰 결과, 공공부문의 유용한 데이터를 개방 및 공유하여 민간부문과의 협력관계를 구축해야 한다는 의견이 있었다. 빅데이터 활용에 대한 주요 변수들의 영향관계를 분석한 결과, 기술 요인, 데이터 요인, 행태 요인이 빅데이터 활용에 영향을 미치는 것으로 나타났지만 법제도 요인은 영향을 미치지 않았다. 또한 모든 독립변수들이 매개변수인 행태 요인에 영향을 미치는 것으로 나타났다. 그리고 빅데이터 기본환경인 독립변수들이 조성되면 빅데이터 이해도, 개방적 태도, 협력, 전문성과 같은 행태 요인이 매개역할을 하여 빅데이터 활용을 향상시키는 것으로 나타났다. 이러한 분석결과를 바탕으로 다음과 같은 정책적 제언을 하였다. 첫째, 빅데이터 활용을 향상시키기 위해서는 개인정보의 이용 및 제공에 관한 법률적 규정들을 숙지해야 한다. 또한 빅데이터 관련 개별법들을 재검토해야 하고 개인정보를 적절히 사용하기 위한 구체적인 지침이 마련되어야 한다. 둘째, 장기적으로 빅데이터를 활용하기 위해서는 대규모 데이터를 수집, 저장, 분석할 수 있는 다양한 기술이 개발되어야 한다. 또한 안정된 네트워크와 보안시스템을 유지 및 관리하기 위한 재정적 지원이 이루어져야 하다. 셋째, 사회전반에 걸쳐 실시간으로 생산되는 다양한 유형의 데이터를 확보해야 한다. 또한 데이터의 정확성, 객관성, 신뢰성을 높이기 위한 분류작업이 필요하고 데이터 품질을 향상시킬 수 있는 관리체계가 구축되어야 한다. 넷째, 빅데이터에 관한 이해를 높이고 전문인력을 양성할 수 있는 교육프로그램이 마련되어야 한다. 또한 공공 및 보유데이터를 개방하거나 공유하려는 문화를 조성하여 공공부문과 민간부문 간의 협력관계를 형성해나가야 한다. 본 연구는 빅데이터 활용에 영향요인을 밝혀내기 위해 실증적으로 연구하였다는 점과 주요 변수들에 대한 인식과 영향관계를 파악하여 빅데이터 활용방향을 제시하였다는 점에서 연구의 의의를 가진다.
주요어: 빅데이터 활용, 행태 요인. 법제도 요인, 기술 요인, 데이터 요인
Korea applied and used Bigdata to variety of fields by selecting it as Government 3.0 Major Project. However, Bigdata were not utilized properly for indefinite regulation and lack of understanding, analyzing technique, and professionalism. The advanced study on Bigdata was mostly for private sectors than public sectors and study approached empirically was insufficient. Therefore, the purpose of this study was to find elements of effect on Bigdata utilization. The influence factors of Bigdata utilization were deduced by reviewing theoretical background and discussion on Bigdata in order to achieve the research purpose. The deduced factors were empirically analyzed through surveys and interviews, and hypothesis was verified and political implication was proposed for influence factors of Bigdata utilization. The survey of this study was performed to public officials of Seoul city and total of 510 surveys were used. In addition, interviews were performed to Bigdata experts. The results of surveys and interviews are as in the following. According to average value(individual/department) of major variables, the total average of Bigdata utilization as dependent variable was 3.07/3.06, Bigdata utilization degree as detail index was 2.83/2.83, and Bigdata utilization volition was 3.31/3.26. According to interview results, there was an opinion that the utilization of Bigdata was low for unopened useful data where public data were actively opened. The total average of legal and institutional factor as independent variable was 2.90/2.97, legal understanding as detail index was 2.74/2.84, legal clarity was 2.81/2.86, information protection was 3.09/3.17, and security system was 2.99/3.02. According to interview results, conflict opinion with survey result was shown that security system was constructed and well managed with regard to control procedure. The total average of technology factor was 3.06/2.78, technology development as detail index was 3.46/2.71, standardization was 2.86/2.79, and network was 2.89/2.86. According to interview results, the difference with average value of network was shown that Korea is IT powerful nation and maintaining stable network with no big issue. The total average of data factor was 3.27/3.29, accuracy as detail index was 3.17/3.24, objectivity was 3.36/3.36, reliability was 3.37/3.33, and data management was 3.20/3.26. According to interview results, there was an opinion that there was difficulty in managing data systematically for no updated data in real time. The total average of behavioral factor as parameter was 2.90/2.89, Bigdata awareness as detail index was 2.90/2.89, open attitude was 2.95/3.02, cooperation was 2.84/2.89, and professionalism was 2.64/2.74. According to interview results, there was an opinion that useful data of public sector should be opened and shared, and construct cooperation with private sector. Technology factor, data factor, and behavioral factor were affecting Bigdata utilization but not affecting legal and institutional factor as influencing relationship of major variables for Bigdata utilization were analyzed. In addition, all independent variables were affecting behavioral factors which were parameters. The behavioral factors such as Bigdata understanding, open attitude, cooperation, and professionalism improved Bigdata utilization as parameter role when independent variables as Bigdata fundamental environment were constructed. The following political proposals were made based on above analysis results. First, legal regulations on utilization and provision of personal information should be well-acquainted in order to improve Bigdata utilization. In addition, Bigdata related specific regulation should be reviewed and concrete guidelines should be made in order to use personal information properly. Second, variety of technologies to collect, save, and analyze large scaled data in order to utilize Bigdata for a long-term. In addition, financial support should be made to maintain and manage stable network and security system. Third, various types of data produced in real time across the board should be secured. In addition, classification work to increase accuracy, objectivity, and reliability of data are needed, and management system to improve data quality should be constructed. Fourth, educational program to increase understanding on Bigdata and train professionals needs to be established. In addition, the relation of cooperation between public sector and private sector should be developed by creating culture of opening or sharing public and possessed data. This study has meaning of research that it empirically researched to reveal influencing factors on Bigdata utilization and proposed Bigdata application plan by apprehending awareness and influencing relationship on major variables.
Key word: Bigdata utilization, behavioral factor, legal and institutional factor, technology factor, data factor
목차
제1장 서론 1제1절 연구의 목적 1제2절 연구의 범위와 방법 4제2장 이론적 배경 및 논의 7제1절 빅데이터의 이해 71. 빅데이터의 등장배경 72. 빅데이터의 개념 및 특성 113. 빅데이터의 유형 174. 빅데이터 활용의 필요성과 기대효과 19제2절 빅데이터 활용방법 231. 빅데이터 활용범위 232. 빅데이터 활용단계 283. 정책과정에서 빅데이터 활용 35제3절 빅데이터 활용의 영향요인 381. 기술적 요인 382. 조직관리적 요인 413. 환경적 요인 454. 기타 요인 50제4절 선행연구의 비판적 검토 53제3장 빅데이터 활용정책 및 사례 56제1절 주요국의 빅데이터 활용정책 및 사례 561. 미국 562. 영국 63제2절 한국의 빅데이터 활용정책 및 사례 701. 중앙정부 702. 지방정부 77제3절 시사점 921. 빅데이터 활용정책의 시사점 922. 빅데이터 활용사례의 시사점 94제4장 연구의 조사 설계 99제1절 연구의 분석틀 99제2절 연구가설 100제3절 연구설계 1071. 변수선정 및 측정지표 1072. 설문조사 및 자료수집 120제4절 측정변수의 신뢰도와 타당도 검정 124제5장 빅데이터 활용의 영향요인에 관한 실증분석 128제1절 인구사회학적 특성 128제2절 빅데이터 활용에 대한 인식 1301. 빅데이터 활용정도 1302. 빅데이터 활용의지 134제3절 빅데이터 활용의 영향요인에 대한 인식 1371. 법제도 요인 1372. 기술 요인 1503. 데이터 요인 1604. 행태 요인 171제4절 빅데이터 활용의 영향요인에 대한 분석 1831. 주요 변수들 간의 상관관계 1832. 빅데이터 활용의 영향요인에 대한 회귀분석 1863. 빅데이터 활용에 대한 경로분석 197제6장 결론 202제1절 연구결과의 요약 202제2절 연구의 시사점 205* 참고문헌 213* 부록1: 설문지 226* 부록2: 인터뷰조사지 230* ABSTRACT 236