메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
이상철 (한양대학교) 이순행 (한양대학교) 박희진 (한양대학교) 김상욱 (한양대학교)
저널정보
Korean Institute of Information Scientists and Engineers 한국정보과학회 학술발표논문집 한국정보과학회 2009 가을 학술발표논문집 제36권 제2호(C)
발행연도
2009.11
수록면
39 - 43 (5page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문에서는 블로그 환경에서 중복포스트 검출을 효과적으로 처리하는 방안에 관하여 논의한다. 먼저, 기존의 웹 환경을 위한 중복문서 검출 기법에서 발생하는 성능상의 문제점들을 지적하고, 이들을 해결할 수 있는 방법을 제시한다. 제안하는 기법은 두 포스트간의 중복된 정도를 측정하는 문제를 두 시퀀스 간의 중복된 정도를 측정하는 문제로 새롭게 해석하는 것에서 출발한다. 효과적인 중복포스트 검출을 위하여 블로그 환경에서 발생되는 중복포스트의 특성에 착안하여 새로운 중복률 측정 함수를 제안하고, 이를 이용하여 시퀀스의 중심으로부터 일정 크기의 서브시퀀스를 추출하여 비교함으로써 중복 여부를 빠르게 판정한다. 본 논문에서는 실제 블로그 데이터를 이용한 여러 가지 실험을 통하여 제안된 기법이 기존의 중복문서 검출 기법보다 효과적인 중복포스트 검출이 가능함을 보인다.

목차

요약
1. 서론
2. 관련 연구 및 연구 동기
3. CentralMatch
4. 성능 평가
5. 결론
감사의 글
참고 문헌

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2010-569-001578268