우리나라의 응급의료체계는 응급환자가 발생할 경우, 병원 전 단계로 현장 처치 및 이송 중 처치를 실시하며, 병원 단계에서 응급실 진료 후 입원진료를 실시한다. 이에 따라 응급환자 관리 관점에서 응급실에서 어떠한 조건을 가진 사람의 사망률이 높은 것인가를 파악하는 것이 필요하므로, 응급실 경유 입원 환자와 일반 입원 환자의 사망률에 대한 결정요인을 비교 분석할 필요가 있다. 한편, 최근 의료보험환자의 증가와 인구 고령화에 따른 진료비의 증가 등으로 입원 환자 재원일수의 합리적 관리는 병원 및 환자 모두에게 이익이 된다. 따라서 재원일수에 영향을 주는 요인을 분석하여 재원일수를 합리적으로 관리할 필요가 있다. 생존기간 또는 재원일수 결정요인을 조사한 많은 선행연구들이 다중회귀분석 또는 로지스틱 회귀분석을 수행하였다. 그러나 다중회귀분석은 선형성, 독립성, 등분산성, 정규성, 다중 공선성의 부재 등의 기본 가정을 만족시켜야 하는 단점이 존재한다. 로지스틱 회귀분석은 로짓의 선형성, 오차항이 독립성, 다중 공선성의 부재 등을 만족시켜야 하는 단점이 있다. 또한 의료데이터는 중도절단된 특징을 지니고 있을 뿐만 아니라, 생존시간 또는 재원시간이 중요함에도 불구하고 다중회귀분석은 이러한 특징들을 반영할 수 없는 문제점이 있다. 따라서 본 연구에서는 일반입원환자와 응급실 경유 입원환자의 생존기간에 영향을 미치는 요인과 입원환자의 재원일수에 영향을 미치는 요인을 분석하기 위해 생존분석을 수행하였다. 이러한 목적을 위하여 본 연구에서는 국민건강보험공단에서 제공한 2016년부터 2019년까지의 총 4개년도에 대한 표본 코호트 DB를 수집하여 분석하였다. 표본 코호트 DB는 국민건강정보DB를 기반으로 개인정보를 보호하는 범위 내에서 연구용으로 공개하기 위하여 2013년 1월에 구축된 자료를 의미한다. 데이터 전처리를 한 후 카플란 마이어 생존 추정을 통해 사회인구학적 특성, 환자별 특성, 검진기록별 특성, 의료기관별 특성 요인에 따라 생존 확률 및 재원확률을 추정하였다. 그러나 카플란 마이어 생존 추정은 분석하고자 하는 요인을 제외하고 다른 요인들을 통제할 수 없는 한계점이 있다. 따라서 다른 변수의 영향을 통제하기 위해 콕스 비례 위험 모형을 통해 계량경제학적 추정에 의해 검증하였다. 이러한 카플란 마이어 생존 분석과 콕스 비례 위험 모형은 데이터 분포에 대한 가정이 필요 없기 때문에 의료 데이터를 이용하여 생존기간 및 재원일수의 결정요인을 조사하는데 적합하다. 본 연구의 의의는 다음과 같다. 첫째, 본 연구는 건강보험공단의 코호트DB를 사용하여 400만 건 이상의 빅데이터를 이용하여 생존분석을 통해 일반 입원환자와 응급실 경유 입원환자의 생존기간의 결정요인을 비교 분석하고 입원환자의 재원일수에 영향을 미치는 요인 분석을 처음으로 시도한 연구이다. 둘째, 카플란 마이어 생존 분석과 콕스 비례 위험 모형을 통해 일반 입원환자와 응급실 경유 입원환자의 생존기간에 영향을 미치는 요인을 비교하였다. 이를 통해 입원환자의 입원시간에 따라 한정된 의료자원의 효율적으로 배분하기 위한 계획을 수립할 수 있을 것으로 기대된다. 마지막으로 카플란 마이어 생존 분석과 콕스 비례 위험 모형을 통해 입원환자의 재원일수에 영향을 미치는 요인을 파악하였다. 기존의 다중회귀분석 또는 로지스틱 회귀분석을 통해 재원일수의 결정요인을 분석한 연구와 본 연구의 결과는 일치하는 부분이 있지만, 병상 수에 따른 병원 유형 등에 있어 차이가 있음을 확인하였다. 하지만 분석결과와는 별개로 생존분석은 시간의 흐름에 따른 재원일수의 변화를 시각적으로 표현 가능하므로 향후 의료정책을 수립할 때 도움이 될 것으로 기대된다.
As a part of South Korean Emergency Medical Services System (EMSS) protocol, an emergency patient is treated onsite or during transfer to the hospital in the pre-hospital stage, while the next stage involves providing emergency room treatment followed by inpatient treatment. From an emergency patient management perspective, it is necessary to identify the high mortality rate of certain conditions in the emergency room, and to compare and analyze the determinants of the mortality rate of patients admitted via the emergency room and general hospitalized patients. In fact, an efficient management of inpatients’ length of stay benefit both hospitals and patients along with an increase in medically insured patients, as well as medical expenses due to aging population. The study therefore aims to identify and analyze the determinants affecting length of stay for effectively manage length of stay. Many previous studies have investigated the determinants of survival period or length of stay using multiple regression analysis or logistic regression analysis. However, multiple regression analysis has the disadvantage of satisfying basic assumptions such as linearity, independence, equal variance, normality, and absence of multicollinearity. Meanwhile, the disadvantage of logistic regression analysis is satisfying the linearity of the logit, the independence of the error term, and the absence of multicollinearity. In addition, there is a problem of multiple regression analysis not reflecting the censored characteristics of medical data regardless of the significance of survival period and length of stay. This study performed survival analysis to examine the determinants of survival period between general inpatients and emergency room inpatients, as well as their length of stay. This study collected and analyzed the sample cohort DB for a total of four years from 2016 to 2019 provided by the National Health Insurance Service to conduct survival analysis. The sample cohort DB refers to data constructed in January 2013 to be disclosed for research within the scope of protecting personal information based on the National Health Information DB. After data preprocessing, we used the Kaplan-Meier survival method to estimate survival and rehospitalization probabilities according to sociodemographic characteristics, characteristics of each patient, characteristics of each examination record, and characteristics of each medical institution. However, the limitation of the Kaplan-Meier survival method is the inability to control other variables except for the variable to be analyzed. We therefore used the Cox proportional hazards model to control the influence of other variables under econometric assumptions. Since both Kaplan-Meier survival analysis and the Cox proportional hazards model do not require data variability assumptions, they are suitable for investigating determinants of survival period and length of stay using medical data. The implications of this study are as follows. First, this is pioneering research comparing and analyzing determinants of the survival period of general inpatients and inpatients admitted via the emergency room through survival analysis using more than 4 million big data from the cohort DB of the National Health Insurance Services, as well as their length of stay. We also compared determinants affecting the survival period of general inpatients and emergency room inpatients through Kaplan Meier survival analysis and Cox proportional hazards model. As a result, we expect hospitals to develop their own plan to distribute limited medical resources according to the given length of stay in an efficient manner. Finally, through the Kaplan-Meier survival analysis and the Cox proportional hazards model, we were able to identify the determinants affecting length of stay. Although the results of this study and those of previous studies that analyzed the determinants of length of stay through multiple regression analysis or logistic regression analysis were consistent, it was confirmed that there were differences in the types of hospitals as of the number of beds. Besides the analysis results, survival analysis is expected to be helpful for establishing future medical policies due to its ability to visually represent the change in length of stay over time. Keywords: Survival Analysis, Kaplan Meier Estimation, Cox Proportional Hazards Model, National Health Insurance, NHIS Sample Cohort DB, Survival Period, Mortality Rate, Length of Stay in Hospital, Discharge Probability. Medical Data.
제1장. 서론 11.1 연구의 배경 21.2 연구의 목적 41.3 연구의 구성 6제2장. 이론적 배경 72.1 응급의료 82.2 재원일수 92.3 생존분석 17제3장. 병원 입원환자의 생존기간 결정요인 분석: 일반 입원환자와 응급실 경유 입원환자 비교 분석을 중심으로 253.1 연구방법 263.1.1 분석절차 263.1.2 데이터 수집 273.1.3 데이터 전처리 303.2 연구결과 323.2.1 일반입원환자의 생존기간 영향요인 323.2.2 응급실 경유 입원환자의 생존기간 영향요인 463.3 연구의 요약 및 의의 60제4장. 의료기관 입원환자의 재원일수 결정요인 분석 634.1 연구방법 644.1.1 분석절차 644.1.2 데이터 수집 644.1.3 데이터 전처리 654.2 연구 결과 704.2.1 연구 대상자의 일반적 특성 704.2.2 카플란 마이어 추정 744.2.3 콕스 비례 위험 모형 824.3 연구의 요약 및 의의 85제5장. 결론 885.1 연구의 의의 895.2 연구의 한계 및 추후 연구방향 91참고문헌 92Abstract 99