메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김호용 (과학기술연합대학원대학교, 과학기술연합대학원대학교 대학원)

지도교수
서동민
발행연도
2020
저작권
과학기술연합대학원대학교 논문은 저작권에 의해 보호받습니다.

이용수2

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
뉴스 기사로부터 이슈를 분석하는 방법은 사회·정치적으로 중요한 문제를 파악하는 데 좋은 수단이다. 또한 인터넷 기술의 발달로 전 세계 각지에서 발생하는 뉴스를 접할 수 있으며, 기사의 발생 빈도는 거의 실시간에 가깝다. 이에 따라 실시간으로 발생하는 뉴스 기사로부터 이슈를 분석하기 위한 다양한 연구가 진행되어 왔다. 하지만 범주에 따라 계층적으로 이슈를 분석하는 연구는 많이 진행되지 않았고, 계층적 이슈 분석을 위한 기존의 연구에서 제안하는 방식 또한 뉴스 기사 증가에 따라 군집화 속도가 느려지는 문제점이 있다. 따라서 본 논문에서는 뉴스 기사의 이슈를 분석하는 계층적·점증적 군집화 방식을 제안하고 군집 성능과 속도를 개선한다. 제안하는 군집화 방식은 샴 신경망을 이용한 가중 코사인 유사도 측정 모델 기반의 k-평균 알고리즘을 이용한 단어 군집 기반 문서 표현 방식을 통해 뉴스 기사를 문서 벡터로 표현한다. 그리고 문서 벡터로부터 초기 이슈 군집 트리를 생성하고, 새로 발생한 뉴스 기사를 해당 이슈 군집 트리에 추가하는 점증적 군집화 방식을 제안함으로써 뉴스 기사의 계층적 이슈를 기존 방식보다 빠르게 분석한다. 마지막으로, 본 논문에서 제안하는 방식과 기존 방식들과의 성능 평가를 통해 제안하는 군집화 방식이 정확도 측면에서 기존 방식 대비 NMI 지표 기준 최대 0.26 정도 성능이 향상되었고, 속도 측면에서 약 10배 이상의 성능이 향상됨을 입증하였다.

목차

1. 서론
2. 관련 연구
2.1. 기존 문서 표현 방식
2.2. 기존 군집 분석 기술
2.3. 기존 가중 유사도 측정 모델
3. 제안 방안
3.1. 초기 이슈 군집 트리 생성
3.2. 이슈 군집 트리 업데이트
4. 실험 방법 및 결과
4.1. 워드 임베딩 모델 선정
4.2. 가중 코사인 유사도 측정 모델 학습
4.3. 계층적·점증적 군집화 실험
5. 결론

최근 본 자료

전체보기

댓글(0)

0