메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
김학진 (서일대학교)
저널정보
대한전자공학회 전자공학회논문지 전자공학회논문지 제60권 제9호(통권 제550호)
발행연도
2023.9
수록면
75 - 83 (9page)
DOI
10.5573/ieie.2023.60.9.75

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
한국어 자연어 처리 분야는 구글에서 공개한 BERT 언어모델을 중심으로 활발한 연구가 진행되고 있으나, 한국어의 특성상 많은 제약을 갖고 있다. 개체명 인식(NER)은 정형화되지 않은 방대한 텍스트에 숨어있는 개체명을 검출하고, 이를 미리 정의한 개체명 클래스에 따라 분류하는 자연어 처리(NLP) 태스크 중 하나이다. 개체명 정보는 텍스트 내에서 특정 도메인과 관련된 지식을 이해하는 데에 실마리를 제공하는 어휘 특징(Lexical Feature) 중 하나로 먼저 텍스트 문서로 부터 정보를 추출(Information Extraction)하여 토큰화(Tokenization)와 품사 태깅과 같은 전처리 작업이 필요하다. 본 연구에서는 한국어 처리에 앞서 금융에 특화한 영문 코퍼스를 제시하고자 한다. Financial_phrasebank 데이터셋와 IIRC 회원 약 83개 글로벌 기업의 재정보고서에서 약 8천개의 금융 텍스트를 추출, 통합하여 총 약 12.7천개 문장으로 구성된 데이터셋을 구축하였으며, 전이학습과정에서 분류되는 개체명 클래스를 기존의 7개 클래스 분류에서 15개 클래스로 분류, 확장한 언어 모델을 제안한다. 레이블링을 거쳐 BERT_base 모델을 결합하여 모델 학습을 진행한 후 정확도, 재현율, F1 스코어 등의 검사를 통해 금융 분야에서의 최적의 데이터셋을 제안한다.

목차

요약
Abstract
Ⅰ. 서론
Ⅱ. 이론적 배경
Ⅲ. 연구 방법
Ⅳ. 실험
Ⅴ. 결론
REFERENCES

참고문헌 (32)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-24-02-088062500