메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
남길임 (경북대학교) 안진산 (경북대학교) 황은하 (배재대학교)
저널정보
한말연구학회 한말연구 한말연구 제57호
발행연도
2020.1
수록면
63 - 96 (34page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (5)

초록· 키워드

오류제보하기
The hasty growth of CMC(Computer-Mediated Communication) are nowadays used by many Korean users to express their perspectives on various topics. However most of the data is difficult to process automatically due to the non-standard expressions, neologism including OOV(out-of-vocabulary) and web specific orthographic conventions. This study amis to propose the standardization procedure of Korean UGC corpus by constructing and analyzing Korean Youtube review corpus. For the purpose of this study, 250K word Youtube review corous was built: this was composed of all reviews on the K Drama channeds provided by three main Korean broadcasting companies. Chapter 2 presents the corpus analysis methodology for the research process including Youtube Comment Scraper tool and preprocessing. Chapter 3 addresses the classification of no standard forms, which focus on highly frequent forms in Korean UGC data. Chapter 4 deals with issues and considerations in constructing the parallel corpus between non-standard and standard forms for Korean linguistic analysis and NLP.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0