메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

송광호 (인하대학교, 인하대학교 대학원)

지도교수
김유성
발행연도
2017
저작권
인하대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
본 논문에서는 하나의 문서의 주제에 적합한 키워드를 추출해내기 위해 문서에 출현한 단어들 사이의 동시출현관계, 동시출현 단어 쌍 사이의 출현 종속 관계, 단어들 사이의 공통 부분단어 관계 등의 다양한 관계들을 특징으로 활용하여 구축한 계층적 그래프 모델을 제안하고, 그래프를 구성하는 정점(Vertex)들의 중요도(Score)를 평가할 때 입력 간선(Edge)에 의한 영향뿐만 아니라 출력 간선에 의한 영향도 고려한 새로운 중요도 산출 방법을 제안하며, 이 그래프 모델을 토대로 점진적으로 키워드를 추출해내는 방안을 제안한다.
별도의 추가정보 없이 입력으로 주어진 단일문서 데이터만을 활용해 그 문서에 적합한 키워드를 추출하기 위한 기존의 키워드 추출 연구들은 TF-IDF 중심의 연구, 단어 간 동시출현정보와 같은 새로운 정보를 활용한 연구, 그래프 모델과 같은 새로운 공간모델을 활용하는 연구 등을 제안하였으나 만족할 만한 성능을 보여주지 못하였다. 따라서 본 연구에서는 입력 문서에 대해 앞서 언급한 여러 특징들을 바탕으로 계층적 그래프 모델을 구축하고 이를 중심으로 기존에 많이 사용되는 정점의 중요도 평가방법인 TextRank를 입력 간선뿐 아니라 출력 간선의 영향까지 고려할 수 있도록 변형한 새로운 형태의 알고리즘을 적용해 각 문서에 적합한 키워드를 추출하고자 하였다. 또한 이 방법의 정확성과 주제적 포괄성 검증하기 위해 다양한 분야의 주제를 가진 문서 데이터에 다양한 평가방법을 적용해 기존의 방법보다 전체적으로 더 나은 성능을 보임을 확인하였다.

목차

국문 요약 ⅰ
영문 요약 ⅱ
목 차 ⅲ
그림 목차 ⅴ
표 목차 ⅵ
알고리즘 목차 ⅶ
1. 서 론 1
2. 통계적 접근법 기반 단일문서 키워드 추출 연구 5
2.1 동시출현 관계를 활용한 단일문서 키워드 추출 5
2.2 그래프 모델을 기반으로 한 단일문서 키워드 추출 7
3. 단어 동시출현관계로 구축한 계층적 유향 가중치 그래프 모델을 활용한 키워드 자동 추출 기법 10
3.1 프로세스 개괄 10
3.2 단어 동시출현 행렬 구축 및 단어 쌍 연관거리 연산 11
3.3 동시출현 단어 쌍 사이의 출현 종속 관계 및 공통 부분단어 관계를 활용한 계층적 유향 가중치 그래프 구축 15
3.3.1 문서에 출현한 단어들의 노드화 18
3.3.2 단어 동시출현관계 및 출현 종속관계를 활용한 그래프 형성 18
3.3.3 대표 노드 간 공통 부분단어 관계를 활용한 그래프 형성 27
3.4 점진적 키워드 추출 31
4. 실험 및 평가 33
4.1 실험 환경 33
4.2 분야 별 키워드 추출 결과 34
4.3 기준 별 정확도 산출 결과 35
4.3.1 제목에 출현한 단어 대비 추출 정확도 36
4.3.2 저자 선정 키워드에 출현한 단어 대비 추출 정확도 36
4.3.3 제목 및 저자 선정 키워드에 출현한 단어 대비 추출 정확도 37
4.4 실험결과 평가 및 분석 38
5. 결론 40
참고 문헌 41

최근 본 자료

전체보기

댓글(0)

0