메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
저널정보
한국한문학회 한국한문학연구 한국한문학연구 제77호
발행연도
2020.1
수록면
543 - 570 (28page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
지금 한문학 연구는 새로운 전환기를 맞이하고 있다. 빅데이터 처리 기술을 통하여 이전과 다른 연구 접근이 가능해졌다. 그러나 한문학 연구자가 기술에 대한 이해가 없다면 연구의 적용은 기대하기 어렵다. 빅데이터 기술을 우리 한문학에 적용하면 어떠한 성과를 얻을 수 있는 보여주는 것이 구글의 엔그램 뷰어(Ngram viewer)이다. 한국고전종합DB의 󰡔한국문집총간󰡕은 우리나라의 엔그램 뷰어를 구축할 수 있는 좋은 자료이다. 본고는 초보적 수준의 󰡔한국문집총간󰡕 엔그램 분석 프로그램을 개발하면서 발생한 문제점을 검토하고 그 개선 방향을 모색하여 향후 엔그램 뷰어를 구축하려는 연구이다. 기본적으로 코퍼스는 분석을 전제로 구축한다. 그러나 󰡔한국문집총간󰡕은 아쉽게도 검색이 가능한 텍스트의 개념으로 설계하였다. 그러므로 빅데이터 분석을 시도하려면 자료의 재가공이 필요하다. 재가공의 어려움은 작자가 다른 작품이 섞여 있거나 각주와 같이 분석에서 제외해야 할 자료가 있으므로 이를 처리할 정밀한 알고리즘이 필요하다. 이외에도 이체자와 동의어의 처리, 문체 분류와 제목의 처리 등을 해결해야 정확한 분석이 가능하다. 엔그램 뷰어를 구축하려면 먼저 엔그램 분석 프로그램이 필요하다. 엔그램 분석은 음절 혹은 어절 단위로 가능하지만, 어절을 정확히 구분할 수 없는 한문학 자료의 특성상 음절 단위 분석이 필수적이다. 현재 개발한 엔그램 프로그램은 음절 단위 분석을 통하여 문집의 그램별 통계, 문집과 문집의 공유 그램, 그램 유사도 수치를 제공하고 문집과 문집의 유사한 구와 편을 찾아주는 기능이 있다. 하지만 문집과 문집 일대일 비교만 가능하고 전체 문집을 대상으로 한 분석은 아직 불가능하다. 시험 분석을 통하여 오류를 개선하여 엔그램 분석 프로그램의 정확도를 높이고 다양한 기능을 추가하면 이를 바탕으로 한국형 엔그램 뷰어가 가능하다. 한국형 엔그램 뷰어는 연구의 보조도구이며, 그 성패는 한문학 자료의 성격을 이해하고 유용하게 활용할 수 있는 프로그램을 설계할 수 있는 연구자의 역량에 달려 있다. 한국형 엔그램 뷰어를 완성하려면 본고에서 검토한 난관들을 해결하여야 하며, 이는 개인의 노력만으로 한계가 있다. 학계의 적극적 관심과 지원을 기대한다.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0