본 연구는 데이터마이닝 분석 방법 중 회귀모형분석, 의사결정나무분석 그리고 인공신경망분석의 세 가지 분석방법을 적용하여 내부회계관리제도의 취약기업과 정상기업에 대한 예측력이 가장 좋은 분석방법임을 찾고자 하였다. 이를 위하여 2006년부터 2012년까지 7년간의 취약기업을 추출하였으며 소속시장별로 살펴보면 KOSPI 34개 기업, KOSDAQ 143개 기업 그리고 기타 40개 기업, 총 217개의 취약점을 나타내는 기업을 대상으로 하였다. 취약기업에 대응 하는 기업은 취약기업의 업종이 같은 기업 중 자산총액이 비슷한 기업으로 1배수 표본기업, 3배수 표본기업, 10배수 표본기업에 해당하는 기업의 25개 변수를 사용하여 분석을 실시하고 소속시장에 따라서 예측력을 비교하였으며, 인공신경망분석 중에서 은닉층수에 따른 예측력을 비교하였다. SAS 버전 9.2 패키지에 포함 하고 있는 Enterprise Miner 버전 4.3을 이용하여 회귀모형분석, 의사결정나무분석 그리고 인공신경망분석의 분류율, 오분류율, 반응률 및 누적반응률을 통하여 예측력을 검증하고자 하였다. 분석결과 표본기업의 수가 많을수록 인공신경망분석이 분류율, 오분류율, 반응률과 누적반응률에서 높은 예측력이 나타났고, 소속시장에 따른 예측력은 KOSPI, KOSDAQ, 기타법인 순서로 예측력이 나타났으며, 의사결정나무분석과 인공신경망분석이 비슷한 수준이거나 기타법인의 경우, 의사결정나무분석이 조금 더 높은 예측력을 나타냈다. 인공신경망분석 중 은닉층의 수에 따른 예측력을 비교해 본 결과 분류율은 은닉층의 수가 많다고 해서 예측력이 우수하다고는 할 수 없었고 반응률과 누적반응률은 은닉층의 수가 많아질수록 높은 값을 나타냄을 확인 하였다. 본 연구는 내부회계관리제도의 평가모형 개발에 전통적으로 활용되어 왔던 회귀모형분석, 변수들이 많은 경우 시간 및 비용의 한계점을 나타내는 의사결정나무분석과 아직은 생소한 인공신경망분석의 예측력을 분석하였고, 분석 결과 우수한 예측력을 보유한 인공신경망분석을 이용할 경우 다른 분석방법과 비교할 때 높은 예측력의 가능성을 제시하였다.
The purpose of this study was to predict enterprises having internal accounting control system weaknesses (IACW) by using regression analysis, decision tree analysis and neural network analysis. The enterprises that have IACW were selected from 2006 -2012 KOSPI, KOSDAQ, and off-board market. A total of 217 enterprises were selected: 34 from KOSPI, 143 from KOSDAQ, and 40 from off-board market. Matched sample enterprises without IACW must be in the same industry as the enterprises having IACW and must have a similar total amount of assets as the IACW enterprises. In accordance with the defined rules above, the sample enterprises were categorized by the same number of IACW enterprises, 3 times the number of IACW enterprises, and 10 times the number of IACW enterprises in order to analyze with 25 variables to compare the predictive rates. Furthermore, predictive rates were compared according to the number of hidden layers in the neural network analysis. This study was verified by a software called “Enterprise Miner Ver 4.3” in SAS Ver 9.2 package for verifying predictive rates in regression analysis, decision tree analysis, and neural network analysis. The verified data obtained slightly different results according to the number of sample enterprises. Neural network analysis presented a better predictive rate in the ''10 times the number of sample enterprises'' category. In the case of percentage analysis between classification rate and misclassification rate, the classification rate presented a good result in the order of neural network analysis, decision tree analysis, and regression analysis. As a result, neural network analysis proved to be better than other analysis methods. The misclassification rate presented a good result in the order of neural network analysis, decision tree analysis, and regression analysis. In addition, neural network analysis obtained a good result in predictive rate. The misclassification rates were verified by training, validation, and testing. Training presented zero value for three of the analysis methods. Validation presented good result in the order of neural network analysis, decision tree analysis, and regression analysis. Testing presented the same result as validation. Consequently, neural network analysis proved to be better than other analysis methods. Predictive rate, reaction rate, and accumulated reaction rate for regression analysis, decision tree analysis, and neural network analysis presented good results in the order of neural network analysis, decision tree analysis and regression analysis. Neural Network Analysis obtained a better result than other analysis methods according to the attached graphs in this study. Predictive rate according to the markets presented good results in the order of KOSPI, KOSDAQ, and off-board market. The results of the predictive rate with decision tree analysis and neural network analysis were similar or decision tree analysis gave a slightly better result than neural network analysis. In other words, data mining with the data among similar sample enterprises presented a similar predictive rate, and the data, when considered with various sample enterprises and various conditions, showed that neural network analysis obtained more valuable data than other analysis methods. However, when comparing the data in neural network analysis according to the number of hidden layers, the working efficiency of neural network analysis did not increase despite of increasing number of hidden layers. Classification rate and misclassification rate obtained the same results whatever the number of hidden layers, but reaction rate and accumulated reaction rate were increased according to the increasing number of hidden layers. This study was performed with regression analysis, which is conventionally used for developing modules of internal control and assessment; decision tree analysis, which has time and cost limitations when it has many variations; and neural network analysis, which is still a brand new method. This study concluded that neural network analysis presented greater efficiency of explanation, stronger power of verification, and a more reliable predictive rate than other analytical methods.
목차
Ⅰ. 서론 11. 문제의 제기 및 연구의 목적 12. 연구의 범위 및 방법 2Ⅱ. 이론적 배경 및 선행연구 51. 이론적 배경 51) 내부회계관리제도 52) 데이터마이닝 122. 선행연구 141) 내부회계관리제도 취약점의 연구 142) 데이터마이닝의 연구 22Ⅲ. 연구설계 261. 변수의 선정 262. 변수의 정의 273. 표본 284. 분석방법 321) 모형분석 322) 시장별 예측력 비교분석 463) 인공신경망분석 은닉층 비교분석 46Ⅳ. 연구결과 분석 491. 변수의 선택 492. 기초통계량 503. 모형의 요약 514. 모형의 결과 비교 571) 분류율 비교 572) 오분류율 비교 603) 반응률 및 누적반응률 비교 625. 소속시장에 따른 모형의 비교 661) 분류율 비교 662) 오분류율 비교 703) 반응률 및 누적반응률 비교 726. 은닉층 수에 따른 비교 767. 분석결과의 요약 78Ⅴ. 결론 811. 연구결과의 요약 및 결론 812. 연구의 시사점 및 연구한계 82참고문헌 85Abstract 89