메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
박진호 (서울대학교) 송성주 (고려대학교)
저널정보
중앙대학교 인문콘텐츠연구소 인공지능인문학연구 인공지능인문학연구 제4권
발행연도
2019.1
수록면
134 - 166 (33page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
Symbolic AI에서는 도메인 지식이 중요시되었다. 규칙 기반 자연어처리에서도 언어학적 지식이 중요한 역할을 담당했다. 확률 기반 자연어처리와 기계학습 기법이 발달하면서 도메인 지식의 역할은 축소되었다. 딥러닝이 대두하면서, 자질 공학과 도메인 지식의 역할은 훨씬 더 축소되었다. 딥러닝 시대에도 여전히 도메인 전문가(언어학자)의 역할이 중요함을 증명하기 위해 한국어 형태소분석기를 개발하였다. 한국어는 형태음소적 교체, 탈락, 축약이 활발하여 분절 과제가 쉽지 않지만, 분절 과제를 분류 문제로 재설정하면 기계학습으로 더 쉽게 해결할 수 있게 된다. 이를 위해서는 분절 이전의 입력의 각 음절과 분절된 출력의 대응하는 문자열 사이의 매핑 관계를 망라적으로 목록화하는 것이 관건이다. 1200만 어절 규모의 세종 형태의미 분석 말뭉치를 통해 이러한 매핑에 200개 유형이 있음을 확인하였다. 이 200개 범주를 바탕으로 LSTM 기반 신경망 모델을 만들어 훈련시켰다. 분절 문제가 해결되면, 분절된 각 토큰에 대한 레이블링은, 영어 등에 대한 선행 연구로 친숙한 연쇄 레이블링 알고리즘으로 쉽게 해결할 수 있다. 이 두 가지 모델과 사전을 결합하여, F1 스코어 98.0%의 성능을 얻을 수 있었다. 이 실험은 딥러닝 시대에도 도메인 지식이 여전히 중요함을 보여준다.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0