최근 다양한 어플리케이션의 도입, 가상화 솔루션의 확대, 전자문서 스토어생성 및 문서의 공유, WEB2.0 확대에 따른 데이터의 폭발적인 증가, 디지털보존기록 같은 다양한 요인으로 인해 스토리지에 저장되는 데이터는 매년 기하급수적으로 늘어나고 있다. 또한 데이터의 개수가 늘어나면 늘어날수록 백업 및 복구에 소요되는 시간이 기하급수적으로 늘어나게 된다. 본 논문은 대규모 데이터를 공유하는 스토리지 환경에서 데이터의 중복을 제거하여 백업에 소요되는 시간과, 이에 대한 성능을 평가하고 효율적인 백업환경을 제안하였다. 이는 향후 대용량 스토리지 환경에서 데이터 백업시스템을 모델링 하는데 참고가 될 것이다.
Due to the recent introduction of various applications, spread of virtualization solutions, creation and share of digital document stores, exploding increment in data due to the spread of WEB2.0, and digital archiving, the amount of data being saved in storage is increasing exponentially each year. And as the number of data increases, the time it takes to backup and recover also increases exponentially. This paper proposes an efficient backup environment that eliminates overlapping data in a storage environment sharing mass data, and evaluates the time needed for backup and its performance. This will later be a reference for data backup system modeling of mass storage environments.