메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
박종수 (성신여자대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회논문지 : 데이타베이스 정보과학회논문지 : 데이타베이스 제41권 제4호
발행연도
2014.8
수록면
256 - 261 (6page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
Top-k 유사도 조인 문제는 두 개의 입력 레코드 집합들에서 유사도를 기준한 상위 k 개의 레코드 쌍을 찾는 것이다. 샘플링 기법을 이용하여 상위 k 개의 유사도 조인 쌍을 반환하는 효율적인 알고리즘을 제안한다. 입력 레코드들의 표본에서 집합 유사도 조인들의 히스토그램을 구성하고, 상위 k 개의 조인 쌍을 위한 추정 유사도 한계치를 통계 추론으로 95% 신뢰 구간의 오차 한계 내에서 계산한다. 상위 k 개의 유사도 조인을 얻기 위하여 최소-히프 구조를 사용하는 일반 유사도 조인 알고리즘에 이 추정 한계치를 적용한다. 대 용량의 실제 데이터집합에서의 실험결과는 제안된 알고리즘의 좋은 성능을 보여준다.

목차

요약
Abstract
1. 서론
2. 표본에서 유사도 한계치 추정 방법
3. 알고리즘 Sample Top-k SJoins
4. 실험결과
5. 결론
References

참고문헌 (10)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2015-560-002471061