메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

민경현 (서울대학교, 서울대학교 대학원)

발행연도
2020
저작권
서울대학교 논문은 저작권에 의해 보호받습니다.

이용수0

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
최근 다양한 소셜미디어 플랫폼의 등장과 활용이 증가함에 따라 하루에도 수 억 건의 게시물들이 작성되며, 소셜 빅데이터는 다양한 방식으로 장소정보를 포함하고 있다. 다수의 플랫폼들은 장소정보를 입력하는 기능을 제공하고 있다. 하지만 지오태깅 된 게시물의 수가 적어 게시물의 지리정보 및 장소정보가 제대로 활용되지 못하고 있다. 이에 텍스트 데이터의 장소정보를 활용하기 위해 장소정보를 탐지 및 추출하는 방법에 대한 연구가 활발하게 진행되어져 왔다. 그러나 대부분의 연구는 개체명에 해당하는 고유명사로 된 장소정보 추출에 대해 진행되었다. 또한, 개체명인식의 경우 학습을 위한 데이터를 구축하는데 있어서 BIO태깅이 필요하며, 이는 상당한 시간과 인력이 필요하다. 따라서 본 연구에서는 자연어처리 분야에서 널리 사용되고 있는 순환신경망과 최신 딥러닝 기술인 어텐션 메커니즘을 활용하여 BIO태깅을 하지 않고, 기존 개체명인식으로는 탐지할 수 없었던 보통명사를 포함한 확장된 개념의 장소정보를 탐지하고자 하였다. 학습모델은 텍스트 내 장소 정보 포함여부를 약 88%의 정확도로 분류하였고, AUC 0.945의 성능을 보였다. 본 논문에서 제안하는 확장된 장소정보 탐지 기법은 학습데이터 셋 구축을 간소화 하였으며, 고유명사 뿐 아니라 보통 명사까지 포함하는 확장된 개념의 장소정보 탐지가 가능함을 확인하였다. 또한, 본 방법을 통해 사전 또는 학습데이터에 없는 장소정보를 텍스트 내에서 탐지할 수 있으므로, 기존 데이터베이스에 없는 신규 POI를 탐지할 수 있다는 점에서 의의가 있다.

목차

제 1 장 서론 1
1.1 연구 배경 및 동기 3
1.2 관련 연구 4
1.2.1 장소정보의 특징 4
1.2.2 사전 기반 장소정보 탐지 6
1.2.3 규칙 기반 장소정보 탐지 7
1.2.4 머신러닝 기반 장소정보 탐지 8
1.2.5 기존 연구의 한계점 10
1.3 연구 목적 및 문제 정의 11
1.4 약어 정리 13
제 2 장 제안하는 방법 14
2.1 어텐션 기반 장소정보 탐지 모델 16
2.1.1 Fasttext 기반 단어 임베딩 16
2.1.2 양방향 LSTM 기반 시퀀스 인코더 20
2.1.3 어텐션 기반 장소정보 이진 분류기 23
제 3 장 실험 결과 및 분석 26
3.1 데이터 셋 26
3.2 평가 방법 28
3.3 모델의 구성 및 학습 30
3.4 실험 결과 분석 33
3.5 활용 방안 43
제 4 장 결론 45
참고문헌 47
Abstract 53

최근 본 자료

전체보기

댓글(0)

0