이 연구는 창업기업의 후속투자 규모를 결정짓는 요인을 머신러닝(기계학습)을 활용하여 분석한 연구이다. 분석대상은 기술창업기업으로 후속투자를 모니터링 할 수 있는 팁스 창업기업 885개사이다. 이들 기업의 후속투자 규모에 영향을 미치는 요인으로는 창업기업의 특성 변수 즉, 사업 분야, 이공계인력 비중, 지역, 매출 규모, 대표자 특징, 지분율 등 13개 지표와 초기투자사의 특성 변수 즉, 투자사 유형, 투자방식, 소재지 등 4개 지표, 그리고 투자 네트워크 변수 즉, 연결중심성, 커뮤니티, 근접중심성 등 4개 지표를 살펴보았다. 종속변수는 Series A 단계를 전후로 후속투자 규모를 구분하였다. 분석 결과, 투자 네트워크 분석 변수를 포함한 모델의 설명력이 창업기업이나 초기 투자사의 특성만을 포함한 모델보다 더 높았으며, 그 가운데 투자 네트워크 내 응집 그룹에 속하는지 여부가 후속투자에 영향을 미치는 것으로 나타났다. 또한, 팁스 창업기업의 매출 규모와 산업 분야도 후속투자 규모에 영향을 미쳤다. 연구의 시사점은 후속투자는 초기투자 단계와는 다르게 스타트업의 경쟁력, 성장가능성, 업계 네트워크(다른 투자자와의 협력, 시장 내 신뢰도, 업계 연결성 등)에 더 큰 영향을 받는다는 점이다. 초기투자사는 초기 성공에 중요한 역할을 하지만 후속투자 단계에서는 영향력이 낮게 나타났다. 연구의 한계는 창업기업 간 투자 네트워크가 창업기업과 투자사 간의 투자 관계를 기반으로 도출하여 간접적인 네트워크라는 점이다. 향후 창업기업과 창업기업 혹은 창업기업과 투자사 사이에 직접적인 상호작용에 대한 네트워크 데이터가 보완된다면 투자 네트워크 상에서 창업기업과 투자기관의 직접적인 영향력을 반영할 수 있을 것이다. 아울러 본 연구에서 7가지 기계학습 방법을 사용하여 분류 및 예측 성능을 정량적으로 비교 평가한 점도 탐색적 연구로 의의가 있다.
This study investigates the factors influencing the scale of follow-on investments in startups using machine learning-based models. The analysis focuses on 885 technology-based startups participating in the TIPS (Tech Incubator Program for Startups) initiative, selected for their capability to monitor follow-on investment activities. The determinants examined include (1) startup-specific variables: industry sector, proportion of STEM (science, technology, engineering, and mathematics) majors, geographic location, revenue size, founder characteristics, equity structure, and 13 related indicators; (2) characteristics of early-stage investors: investor type, investment method, geographic location, and 4 associated indicators; and (3) investment network variables: degree centrality, community structure, closeness centrality, and 4 network-related metrics. The study hypothesizes that the scale of follow-on investments varies depending on the attributes of the startups, the characteristics of early-stage investors, and the structural properties of the investment network. To test these hypotheses, data preprocessing techniques were employed to generate machine learning-based models, analyzing the influence of each variable. The findings aim to provide empirical insights into the determinants shaping the follow-on investment landscape in technology-driven startups. The empirical analysis results indicate that the explanatory power of the model improved when including investment network analysis variables. It was found that variables such as revenue, business sector, and investment network cohesion group of TIPS startups significantly influenced follow-up investments. The study suggests that investment network characteristics have a greater impact on follow-up investment stages than corporate information variables, such as startup characteristics and operator attributes. However, it acknowledges the limitation that the investment network among startups is indirect, based on the investment relationships between startups and investors. In future studies, supplementing with network data on direct interactions between startups or between startups and investors could better reflect the direct influence of startups and investors within the investment network. Additionally, this study provides valuable insights as an exploratory approach by quantitatively comparing and evaluating the classification and predictive performance of 7 machine learning methods.