본 연구의 목적은 한국 프로축구 K리그1 공식기록들의 군집분석 가능 여부와 각 군집의 실제 특성을 파악하는데 목적이 있으며, 경기력을 분석하는 하나의 기초 방법론을 제시하고자 연구를 실시하였다. 본 연구의 대상은 K리그 포털(K LEAGUE PORTAL)의 데이터 센터(data.kleague.com)에서 제공하는 K리그1의 2019년도부터 2022년도 시즌 중 코로나19의 영향으로 축소 운영된 2020년도를 제외한 총 3개 시즌에서 공통으로 수집할 수 있는 기본, 수비, 공격, 패스 유형을 변인으로 설정하였다. 자료처리 방법으로는 수집한 자료들을 Microsoft Excel 2019를 이용해 자료를 정리하고 통계패키지 R 4.2.3 Version을 사용해 자료들을 표준화시킨 후 실루엣(Silhouette) 평가기준을 사용해 객관적인 초기 군집 수 k를 선정하고 SPSS 27.0 Version 통계패키지 프로그램을 사용하여 비확률 통계기법 중 하나인 k-means 군집분석을 사용하여 군집 가능 여부를 파악하였다. 비모수 통계기법인 스피어만 상관관계분석(Spearman Correlation Analysis)과 빈도분석(Frequency Analysis)을 통해 군집 별 특성을 파악하였다. 군집 별 차이를 확인하기 위해 비모수 통계기법 맨 휘트니 U(Mann-Whitney U) 검정을 실시하였다. 유의 수준은 p< .05로 설정하였으며, 다음과 같은 결과를 도출하였다.
첫째, K리그 데이터포털에서 제공되는 한국 프로축구 K리그1의 공식기록은 2개의 군집으로 군집이 가능하였다.
둘째, 2개의 군집 중 평균적으로 높게 나타난 군집 1이 군집 2보다 높게 나타난 변인은 득점, 볼 점유율, 패스 성공률, 유효슈팅, PA내슈팅, 슈팅, 패스, 키패스가 유의한 차이를 나타냈다.
The purpose of this study was to investigate the possibility of clustering the official records of the Korean professional soccer K League 1 and to determine the characteristics of each cluster. Additionally, a basic methodology for analyzing performance was presented. The variables used in this study were the basic, defensive, offensive, and passing types that were collected for all three seasons of the K League 1, except for 2020 due to the impact of COVID-19. The data were organized using Microsoft Excel 2019 and standardized using the R 4.2.3 Version statistical package. The Silhouette evaluation criteria were used to select the initial cluster number, and the k-means clustering analysis, one of the non-probability statistical techniques, was used to determine the possibility of clustering using the SPSS 27.0 Version statistical package. The characteristics of each cluster were determined using the non-parametric statistical techniques of Spearman correlation analysis, Frequency Analysis and Mann-Whitney U test, with a significance level of p< .05
First, the results showed that the official records of the Korean professional soccer K League 1 provided by the K League Data Portal could be clustered into two clusters.
Second, among the two clusters, cluster 1, which showed a relatively higher ranking than cluster 2, exhibited significant differences in the following variables: scoring, ball possession, passing success rate, effective shots, shots in the penalty area, shots, passes, and key passes.
제 1 장 서론 11.1 연구의 필요성 11.2 연구 목적 41.3 연구 문제 및 연구 절차 41.3.1 연구 문제 41.3.2 연구 절차 51.4 용어의 정의 61.4.1 한국 프로축구 61.4.2 축구 경기력 6제 2 장 이론적 배경 72.1 한국 프로축구 72.2 축구의 경기력 82.2.1 기술요인 92.2.2 심리요인 102.2.3 체력요인 102.3 군집분석 112.3.1 계층적 군집분석 112.3.2 비계층적 군집분석 122.4 축구 경기력 분석에 관한 선행연구 13제 3 장 연구 방법 143.1 연구 대상 143.2 연구 도구 153.2.1 자료 수집 153.2.2 자료 정리 163.2.2.1 기본 변인 163.2.2.2 수비 변인 193.2.2.3 공격 변인 223.2.2.4 패스 유형 253.3 자료처리 28제 4 장 연구 결과 294.1 초기 군집 수 k 선정 294.1.1 초기 군집 수 k 선정 294.1.2 변인 간의 상관관계 분석 304.2 군집분석 결과 324.2.1 군집분석 결과 324.2.2 군집의 특성 파악 34제 5 장 논의 395.1 군집분석 가능 여부 395.2 군집의 경기력 특성 40제 6 장 결론 및 제언 426.1 결론 426.1.1 한국 프로축구 K리그1 공식기록의 군집 가능 여부 426.1.2 한국 프로축구 K리그1 공식기록의 군집 특성 426.2 제언 43참고문헌 44