메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
김나랑 (동아대학교)
저널정보
국제e-비즈니스학회 e-비즈니스연구 e-비즈니스연구 제25권 제1호
발행연도
2024.2
수록면
121 - 132 (12page)
DOI
10.20462/tebs.2024.2.25.1.121

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
머신러닝 기술의 발전으로 텍스트 자동 분류에 대한 연구가 증가하고 있다. 텍스트 자동 분류는 사전에 정의된 범주의 레이블을 각 데이터에 부여함으로써 대량의 데이터를 효율적으로 할당하는 것이다. 지금까지의 분류 연구는 자질 선정이 용이한 뉴스나 학술 데이터 및 SNS 데이터 등으로 대규모 데이터를 대상으로 많이 이루어졌다. 이와 달리 민원처럼 소규모의 비격식(informal) 텍스트를 대상으로, 다양한 주제 범위의 데이터를 다시 의미, 유형, 형식 등 세부 범주별로 분류하기는 어려운 일이다. 이에 본 연구의 목적은 소규모의 비격식 텍스트로 구성된 다범주 자동 분류에서 가장 성능이 좋은 알고리즘을 찾아내는 것이다. 이를 위해 먼저 2016년부터 2020년까지 부산시 민원 데이터를 수집하여 데이터 전처리를 실시하였다. 이후 민원의 특성 범주의 레이블을 정의하였고, 마지막으로 지도학습으로 각 분류 알고리즘의 성능을 비교 분석하였다. 실험결과 분류의 정확도는 CNN < LSTM < Ko-BERT의 순서로 나타났다. 따라서 비격식어이며 소규모인 다양한 주제에 대해 유형 및 특성별로 복합적 다범주 분류에서는 문서의 자질(feature)을 추출하는 것이 아니고, 시퀀스와 컨텍스트를 고려하여야함을 밝혀냈다. 본 연구의 학문적 공헌도로는 전통적인 분류기부터 딥러닝의 최신 알고리즘을 같은 실험 환경에서 비교 분석하여 알고리즘 간의 차이를 규명하였다는 점이다. 실무적으로는 본 연구에서 비격식(informal) 문서인 민원에 대한 분류기 성능 평가 결과는 향후 소규모의 SNS 데이터 및 다른 민원 등 다양한 주제이며 복잡한 범주에 대한 낮은 품질의 텍스트 데이터의 처리 및 분류에 활용될 수 있을 것이다.

목차

ABSTRACT
Ⅰ. 서론
Ⅱ. 이론적 고찰
Ⅲ. 연구 방법
Ⅳ. 결론
참고문헌
국문초록

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0