메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
이대영 (건국대학교) 이현숙 (건국대학교)
저널정보
한국교육평가학회 교육평가연구 교육평가연구 제34권 제1호
발행연도
2021.1
수록면
1 - 30 (30page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
LDA 토픽 모델링으로 텍스트 자료의 토픽을 추출하고 그에 따라 문서를 분류하고자 할 때, 설정하는 토픽 수는 토픽 분류의 정확성과 타당성에 큰 영향을 미친다. 본 연구는 LDA에서 적정한 토픽 수를 정하는 방법으로 조화평균을 사용하는 방식과 혼잡도를 사용하는 방식을 비교 검토하였다. 이에 논문 초록, 뉴스 기사, 그리고 소설 자료를 대상으로 적정 토픽 수를 추출하였으며, 추출된 토픽 수에 대한 신뢰성과 적정성을 비교함으로써 적정한 토픽 수를 보다 합리적으로 정하는 방법이 무엇인지 탐색하였다. 토픽 선정의 적정성을 판정하는 데 있어서 통계적 정보를 바탕으로 결정할 수 있을 때 보다 적절하다는 관점에서 접근하였고, 반복 시행에 의해서도 수리적으로 안정된 토픽의 수를 정할 수 있을 때 더 신뢰성이 높다고 평가하였다. 적정성 평가 준거로는 LDA 모델의 분포와 분포를 검토하여 확률적으로 평가하였다. 연구 결과 첫째, 조화평균 방식이 혼잡도 방식보다 연구자의 주관적 판단에 의존하는 정도가 낮았다. 또한, 조화평균 방식은 LDA 모델의 를 조절하여 토픽이 과대 추출되는 경향을 줄일 수 있었다. 둘째, 조화평균 방식은 분포와 분포 측면에서도 더 독립적이고 적정한 토픽 군집으로 분류할 수 있었다. 셋째, 조화평균 방식을 적용함에 있어서 코퍼스를 구성하는 문서 자료의 특성을 고려하여 적정한 를 정해야 함을 알 수 있었다. 이와 같은 연구 결과를 바탕으로, 조화평균 방식의 특징과 확장 가능성, 연구의 제한점 등을 논의하였다.

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0