텍스트 기반 이미지 생성 (text-to-image) 모델의 발전에 따라 프롬프트 (prompt) 엔지니어링이라는 새로운 분야가 대두되었다. 이는 모델 결과물의 품질이 프롬프트를 얼마나 잘 사용했는지에 의해 결정되기 때문에 사용자가 원하는 고품질의 이미지를 생성할 수 있는 구체적이고 명확한 프롬프트를 작성하는 것의 중요성으로부터 비롯되었다. 이에 따라 프롬프트 분석 연구가 진행되어 왔으며, 이 과정의 일환으로 생성된 이미지에서 프롬프트를 예측하는 방법도 제안되었다. 이에 따라 본 논문에서는 이미지로부터 프롬프트를 예측 (image-to-prompt)하는 작업을 수행하는 앙상블 모델을 제안한다. 실험 결과로 이미지 캡션을 생성하는 단일 모델보다 평균 0.1381 을 향상시키며 제안된 모델의 성능을 검증했다.