메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

정상원 (고려대학교, 高麗大學校 컴퓨터情報通信大學院)

지도교수
白斗權
발행연도
2015
저작권
고려대학교 논문은 저작권에 의해 보호받습니다.

이용수6

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
통계기반 기계번역 시스템 (Statistical Machine Translation, SMT)은 기계번역시스템 중에서 최근 활발히 연구되고 있는 분야이다. 통계기반 기계번역은 대용량의 말뭉치를 사용할 수 있어 특정 언어 쌍에 제한을 덜 받아 모델을 자동으로 학습할 수 있으며 다른 언어에 일반화하여 적용이 가능하다는 장점이 있다. 그러나 한국어와 영어 간 통계기반 기계번역에 있어서는 어순과 단어 수의 차이로 인한 문제를 해결할 필요성이 여전히 남아 있다. 이에 본 논문에서는 어순이 다른 한국어와 영어 간 병렬 말뭉치 및 통계기반 기계번역 학습 시스템인 Moses를 이용하여 병렬 말뭉치 분석 및 재구성을 통한 번역율 향상 방안을 연구하였다.

목차

1. 서론 1
1.1. 연구의 배경 1
1.2. 연구의 목적 3
1.3. 관련 연구 5
1.3.1. 한국어와 영어 간 단어 수 차이에 대한 연구 5
1.3.2. 통계기반 기계번역을 위한 어순 조정에 관한 연구 5
1.3.3. 병렬 말뭉치의 대용량 구축에 관한 연구 6
2. 통계기반 기계번역과 Moses 7
2.1. 통계기반 기계번역 7
2.1.1. 통계기반 기계번역의 개요 7
2.1.2. 통계기반 기계번역의 프로세스 8
2.2. Moses 9
2.2.1. Moses의 개요 9
2.2.2. Moses의 구조 10
2.2.3. Moses의 특징 11
3. 분석환경 구현 12
3.1. 병렬 말뭉치 수집 12
3.2. 통계기반 기계번역 시스템 구현 15
3.2.1. 시스템 플랫폼 구축 15
3.2.2. 베이스 시스템 프로세스 17
3.3. 한국어와 영어 간 번역수준 정의 20
4. 한국어와 영어 간 병렬 말뭉치 분석 21
4.1. 한국어와 영어 간 Distortion 현상 분석 21
4.2. 한국어와 영어 간 단어 수 차이 분석 24
4.2.1. 일반적인 번역에서 주로 나타나는 단어 수 차이 현상 24
4.2.2. 의역에서 주로 나타나는 단어 수 차이 현상 26
4.2.3. 한국어와 영어 간 단어 수 차이 분석 결과 31
4.3. 단어정렬 및 번역모델에 따른 번역결과 분석 33
4.4. 한국어와 영어 간 병렬 말뭉치 분석결과 35
4.4.1. 한국어와 영어 간 어순처리 및 단어 수 재구성 37
4.4.2. 번역모델 및 단어정렬 재구성 38
5. 제안내용 40
5.1. 어순처리 및 단어 수 재구성 41
5.1.1. Distortion이 큰 단어의 어순 재배치 41
5.1.2. 한국어에 없는 영어 단어의 삭제 43
5.1.3. 의역된 문장을 일반적인 번역 문장으로 변환 45
5.2. 번역모델 및 단어정렬 재구성 46
5.2.1. 번역 시 사용되는 단어의 일관성 적용 46
5.2.2. 원시언어 (영어)의 문장 재구성 48
6. 번역품질 평가 50
6.1. BLEU에 의한 번역품질 분석 50
6.1.1. BLEU의 개요 50
6.1.2. 병렬 말뭉치 재구성 전과 후의 BLEU 점수 51
6.2. 유럽언어와의 BLUE 점수 비교 53
7. 결론 및 향후 과제 54
7.1. 결론 54
7.2. 향후 과제 56
참고문헌 58
Abstract 60
감사의 글 61

최근 본 자료

전체보기

댓글(0)

0