우리나라는 예로부터 중국과 정치, 외교, 경제적면에 있어 매우 긴밀한 관계에 있었으며, 이로 인해 다양한 조선시대 중국어 역학서가 편찬되었다. 이러한 중국어 역학서는 근대 어휘, 어음, 문화의 특징과 변화상을 알 수 있는 매우 중요한 자료로 학계에서 많은 연구가 되어왔으나 우리나라는 서적을 중심으로 하는 연구 방법과 환경에서 벗어나지 못하고 있으며, 고문헌에 대한 디지털화 작업이 매우 초보적인 단계에 머물러 있다. <국립중앙도서관>이나 <규장각 원문검색서비스>에서는 대부분 원문 이미지만을 제공하며, <한국어 역사 자료 말뭉치>는 디지털 텍스트를 제공하지만, 원문에 대한 전체 정보를 제공하지는 않으며, <조선시대 외국어 학습서 DB>에서는 언해문이 디지털 텍스트로 정리되어 있고, 특정 단어를 기준으로 검색이 가능하나 사용성이 떨어진다. 이에, 본 연구는 『老乞大諺解』, 『朴通事諺解』, 『譯語類解』, 『伍倫全備諺解』, 『譯語類解補』, 『朴通事新釋諺解』, 『重刊老乞大諺解』, 『華音啓蒙諺解』, 『華語類抄』등 11종의 중국어 역학서를 대상으로 어음, 어휘 시맨틱 데이터를 구축하였다. 어음 데이터는 원문의 입력을 거쳐 좌음, 우음 등의 정보, 『廣韻』, 현대 중국어 병음을 데이터로 구축하였으며, 어휘 데이터는 ‘명칭 및 호칭’, ‘장소명’, ‘지명’, ‘복식’, ‘음식’, ‘주거’, ‘식물’, ‘동물’, ‘매매’, ‘서명’의 10개 주제와 관련된 어휘를 추출하여 엑셀 시트에 해당 어휘, 주제, 뜻을 정리하고 어휘와 원문, 어휘와 번역문을 연결하는 데이터를 구축하였고, RDB(Relational Database) 적재를 위한 TSV(Tab Separated Values) 형식과 온라인 서비스를 위한 XML(eXtensible Markup Language) 형식으로 변환하였다. 이는 조선시대 중국어 역학서를 이용하여 고도화된 정보를 제공하는 최초의 종합 데이터베이스로, 향후 국내 문헌을 기반으로 한 다양한 분야의 디지털화를 진작시키는데 기여할 것이다.
Since ancient times, Korea has been in a very close relationship with China in terms of politics, diplomacy, and economy, and for this reason, various Chinese textbook of the Chosun Dynasty were compiled. These Chinese textbooks are very important materials that show the characteristics and changes of modern vocabulary, sounds, and culture, and have been studied in academia, but Korea has not escaped the research method and environment centered on books, and digitization of ancient documents remains at a very basic stage. Most of the original images are provided by <National Library> or <Gyujanggak Original Text Search Service>, and <Korean History Data corpus> provides digital text, but does not provide full information on the original text, and <Chosun Foreign Language Learning DB> organizes language text into digital text, but is less likely to use. Therefore, this study constructed semantic data of sound and word using 11 different type of Chinese textbooks, Laoqida yanjie, Piaotongshi yanjie, Yiyuleijie, Wulunquanbei yanjie, Yiyuleijiebu, Piaotongshi Xinshi yanjie, Chongkan Laoqida yanjie, Huayin Qingmeng yanjie, Huayuleichao. The sound data were input from the original text to construct information such as left and right phonetic transcription, Guangyun, and modern Chinese pinyin, and the vocabulary data was extracted from the 10 topics of ‘name and title’, ‘location name’, ‘place name’, ‘dress’, ‘food’, ‘residence’, ‘plant’, ‘animal’, ‘trade’, ‘publication name’. This is the first comprehensive database that provides advanced information using Chinese textbooks of the Chosun Dynasty, and will contribute to boosting the digitalization of various fields based on domestic literature in the future.