목적: 이 연구의 목적은 공정 데이터를 이용하여 공정 과정에서의 제품 최적화 프로세스를 통해 공정 제품 수율을 향상하는 것이다. 최근 머신러닝이나 딥러닝 등을 활용하여 제조 공정에서의 저비용 고효율 생산을 위한 연구가 지속되고 있다. 본 연구는 설명할 수 있는 인공지능, XAI 기법을 활용하여 제조 공정 과정에서의 제품 불량 여부에 영향을 미치는 주요 변수들을 도출하고 해당 변수들의 최적 범위를 제시함으로써 제품 수율 개선 방법론을 제안하고자 한다.
방법: 이 연구는, KAIST가 주관하는 인공지능 중소벤처 제조 플랫폼(KAMP)에 공개되어 있는 사출성형기 AI 데이터 셋과 CNC 머신 AI 데이터 셋을 이용하여 연구를 수행한다. XAI 기반 SHAP 기법을 이용하여 각 공정 데이터에서 제품 불량 여부에 영향을 미치는 주요 변수들을 추출한다. 학습 알고리즘으로는 XGBoost와 LightGBM을 사용하였으며 각 모델 별로 사출 공정의 경우 6-7가지 변수를, CNC 공정의 경우 8-10가지 변수를 주요 공정 변수로 추출한다. 이후에는 ICE 기법을 이용해 각 공정 변수의 최적 통제 범위를 제시한다. 최종적으로 연구의 유효성 검증을 위해 각 공정 변수의 최적 통제 범위에 해당하는 데이터 프레임을 구축하고 해당 데이터의 불량률과 기존 불량률 비교를 통해 제품 수율 개선 여부를 확인한다.
결과: 이 연구는 Case Study로 사출 공정과 CNC 공정 두 경우에서의 본 연구 방법론을 제안하며, 두 경우 모두 유효성 검증을 통해 제품 수율이 향상됨을 확인하여 공정 종류와 상관없이 본 연구에서 제안하는 방법론의 유효성을 입증하였다.
결론: 사출 공정 데이터에서 XGBoost로 학습한 경우 Test Data에서의 개선 불량률은 0.21%, LightGBM으로 학습한 경우 Test Data에서의 개선 불량률은 0.29%로 기존 Train Data 불량률 1.00% 대비 각각 0.79%p, 0.71%p 개선됨을 확인하였다. CNC 공정 데이터에서 XGBoost로 학습한 경우 Test Data에서의 개선 불량률은 0.82%, LightGBM으로 학습한 경우 Test Data에서의 개선 불량률은 0.97%로 기존 Train Data 불량률 29.18% 대비 각각 28.36%p, 28.21%p 개선됨을 확인하였다.
Keywords: 사출 공정, CNC 공정, XAI, SHAP, ICE
Purpose: The purpose of this study is to propose an optimization process to improve product yield in the process using process data. Recently, research for low-cost and high-efficiency production in the manufacturing process using machine learning or deep learning has continued. Therefore, this study derives major variables that affect product defects in the manufacturing process using explainable artificial intelligence and XAI method. After that, the optimal range of the variables is presented to propose a methodology for improving product yield.
Method: This study is conducted using the injection molding machine AI dataset and the CNC machine AI dataset released on the Korea AI Manufacturing Platform(KAMP) organized by KAIST. Using the XAI-based SHAP method, major variables affecting product defects are extracted from each process data. XGBoost and LightGBM were used as learning algorithms, and for each model, 6-7 variables are extracted as the main process variables for the injection process and 8-10 variables for the CNC process. Subsequently, the optimal control range of each process variable is presented using the ICE method. Finally, for validation of the study, a data frame corresponding to the optimal control range of each process variable is constructed and the product yield is improved by comparing the defect rate of the data with the existing defect rate.
Results: This study is a case study. The research methodology in both the injection process and the CNC process was proposed, and in both cases, it was confirmed that the product yield was improved through validation.
Conclusion: In the injection process data, it was confirmed that XGBoost had an improvement defect rate of 0.21% and LightGBM had an improvement defect rate of 0.29%, which were improved by 0.79%p and 0.71%p, respectively, compared to the existing defect rate of 1.00%. In the CNC process data, it was confirmed that XGBoost had an improvement defect rate of 0.82% and LightGBM had an improvement defect rate of 0.97%, which improved by 28.36%p and 28.21%p, respectively, compared to the existing defect rate of 29.18%.
제 1 장 서론 11.1 연구동기 11.2 논문의 구성 2제 2 장 이론적 배경 32.1 XAI(eXplainable Artificial Intelligence) 32.1.1 XAI 32.1.2 SHAP(SHapley Additive exPlanations) 42.1.3 ICE(Individual Conditional Expectation) 72.2 모델 학습 92.2.1 XGBoost 92.2.2 LightGBM 112.3 사출 공정 132.3.1 사출 성형 공정 132.3.2 사출 공정 데이터 소개 152.4 CNC 공정 162.4.1 CNC 가공 공정 162.4.2 CNC 공정 데이터 소개 17제 3 장 방법론 203.1 데이터 수집 및 전처리 203.2 SHAP(SHapley Additive exPlanations) 223.3 ICE&PDP 233.4 유효성 검증 24제 4 장 Case Study 1: 사출 공정 254.1 데이터 수집 및 전처리 254.2 SHAP 264.3 ICE & PDP 284.4 유효성 검증 30제 5 장 Case Study 2: CNC 공정 315.1 데이터 수집 및 전처리 315.2 SHAP 325.3 ICE & PDP 345.4 유효성 검증 38제 6 장 결론 및 향후 연구 396.1 결론 39참고문헌 41