메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
김종훈 (신한대학교) 김정호 (신한대학교) 이상록 (신한대학교)
저널정보
융복합지식학회 융복합지식학회논문지 융복합지식학회논문지 제12권 제3호
발행연도
2024.9
수록면
125 - 133 (9page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문은 추출 요약 기반의 한국어 문서 요약 시스템에서 많이 적용되고 있는 TextRank 알고리즘에서 문장 유사도를 계산하는 다양한 방식들의 성능을 비교 분석하였다. 성능 평가를 위한 데이터셋은 AI 허브에서 제공하는 뉴스 기사와 사설을 적용하여, 문서 종류에 따른 영향을 분석하였다. 그리고, 문서 내의 문장의 개수에 따라 데이터셋을 2가지 유형으로 구분하여 문서의 길이에 대한 영향을 분석하였다. 루지 스코어는 LSA 방식과 TF-IDF 방식에서 가장 높았고, 문서 길이에 따른 영향은 거의 없는 것으로 나타났다. 또한, 요약문 생성시 소요되는 실행시간은 LSA 방식이 가장 짧고, TF-IDF 방식에 비해 1/3로 단축된다. 이는 LSA 방식이 차원 축소를 통한 계산량 감소뿐만 아니라 의미적 유사도를 고려할 수 있기 때문으로 판단된다. 결과적으로 TextRank 기반의 추출식 한국어 문서 요약 시스템에서는 LSA 방식이 가장 우수함을 확인하였다.

목차

ABSTRACT
1. 서론
2. 관련 연구
3. 한국어 요약 시스템 구현
4. 성능 분석 및 평가
4. 결론
References

참고문헌 (0)

참고문헌 신청

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-25-02-091137244