메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

최세목 (충남대학교, 忠南大學校 大學院)

지도교수
박정희
발행연도
2020
저작권
충남대학교 논문은 저작권에 의해 보호받습니다.

이용수1

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
In the Online environment, large amounts of text are being generated in real time. It is important task to detect the occurrence of new topic because text that occur in the online environment is mostly related to actual event. Recently, various embedding models that can convert text to a feature vectors have been proposed. In this paper, we propose a method to detect the occurrence of new topics using text embedding model and anomaly pattern detection technique. And if there is a typographical error in the text, we verify that correcting error affects performance. The experimental results show that the proposed method can detect the occurrence of new topics.

목차

1 서론 1
2 관련 연구 3
3 텍스트 임베딩 방법 5
3.1 Bag of Words (BOW) 5
3.2 word2vec 6
3.3 BERT 8
4 텍스트 임베딩을 활용한 신규 주제 발생 탐지 12
4.1 텍스트 임베딩 12
4.2 오탈자로 인한 Out-of-Vocabulary에 대한 처리 14
4.3 이상 패턴 발생 탐지를 이용한 신규 주제 발생 탐지 16
5 실험 결과 17
5.1 데이터 및 실험 절차 17
5.2 평가 지표 18
5.3 성능 비교 18
5.3.1 텍스트 임베딩 방법에 따른 성능 비교 19
5.3.2 이상치 탐지 모델을 달리 하였을 때의 성능 비교 19
5.3.3 오탈자 교정 20
5.3.4 오탈자 교정 여부에 따른 성능 비교 21
6 결론 23
참고문헌 24

최근 본 자료

전체보기

댓글(0)

0