메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김정미 (인하대학교, 인하대학교 대학원)

지도교수
이주홍
발행연도
2018
저작권
인하대학교 논문은 저작권에 의해 보호받습니다.

이용수3

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
자연어 처리 분야에서도 심층 신경망 기술이 주목되고 있으며, 최근에는 convolution neural network(CNN)기반의 심층 신경망 구조가 이미지 분류뿐만 아니라 자연어 처리의 문서 분류에서도 좋은 성능이 입증되었다. 하지만 convolution neural network(CNN)을 이용한 문서 분류 연구에서는 대체로 문장의 평균 단어수가 적은 짧은 문장에 한하여 적용되었으며, 의미론적 관계가 복잡한 긴 문장은 다루기 어렵다는 단점을 가지고 있다. 본 논문은 기존의 연구의 한계점을 극복하고 더 정확한 문서 분류 성능을 위하여 word2vec을 활용한 recurrent neural network(RNN)기반의 심층 신경망의 접근법을 새롭게 제안한다. 이를 위해 장기 의존성 문제를 극복한 long short-term memory(LSTM)을 사용하여 긴 시퀀스의 입력에서도 효과적인 문서 분류가 가능하도록 하였고, 제안 방식의 효율성을 검증하기 위해 영문 데이터 분 아니라 한국어 영화 리뷰 데이터에 대해서도 실험을 수행하였다. 그 결과 장문을 포함하고 있는 영문 신문 기사에서는 87%, 단문으로 구성된 영문 리뷰 문서에서는 90%, 한국어 영화 리뷰에서는 88%의 문서 분류 정확도를 보였다.

목차

제 1장 서론 ......................................................1
1.1 연구의 배경 및 필요성..............................1
1.2 연구의 목표 및 구성.................................3
제 2장 이론적인 배경..........................................5
2.1 word embedding....................................5
2.2 Recurrent Neural Network(RNN)..............6
제 3장 word2vec을 활용한 RNN기반의 문서 분류 시스템....9
3.1 word2vec을 활용한 데이터 전처리...............9
3.2 제안 방식의 시스템 구조............................10
제 4장 실험 및 평가...........................................14
4.1 실험 데이터 셋 구성................................14
4.2 LSTM의 입력 토큰 개수 설정....................15
4.3 기존 연구와의 비교 실험 및 성능 분석........18
제 5장 결론 및 향후 과제...................................20
참고 문헌 .......................................................21

최근 본 자료

전체보기

댓글(0)

0