메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
김성환 (부산대학교) 조환규 (부산대학교)
저널정보
Korean Institute of Information Scientists and Engineers 정보과학회논문지 : 소프트웨어 및 응용 정보과학회논문지 : 소프트웨어 및 응용 제40권 제1호
발행연도
2013.1
수록면
53 - 60 (8page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
인터넷 상에서 언어는 사용자에 의해 지속적으로 변형된다. 한 문자열로부터 변형된 문자열의 일부 사례가 주어졌을 때, 한 문자열이 같은 문자열로부터 파생된 것인지를 판별하는 문제는 효율적인 근사 문자열 탐색 및 데이터 수집을 위한 중요한 문제이다. 본 논문에서는 주어진 문자열 집합 내에 한 문자열로부터 파생된 변형 문자열들이 있는 경우 이들을 다중 서열 정렬을 통하여 대표 문자열을 정의하고, 이를 이용하여 문자열과 문자열 집합 간의 유사도 계산 방법을 제안하였다. 제안 기법은 문자열 집합의 크기에 관계없이 상수 시간 내에 동작한다. 실험 결과 주어진 문자열 집합의 크기가 100 이상인 경우 기존 기법에 비해 효율적으로 동작하며, 269개 이상의 문자열 집합에 대하여 기존 기법에 비해 2배 이상 빠르게 동작함을 보였다. 또한 실험을 통하여 일부 매개변수 조합이 민감도와 특이도 측면에서 전수 조사를 수행하는 것보다도 우수한 분류 성능을 보이는 것을 확인하였다.

목차

요약
Abstract
1. 서론
2. 문제 정의
3. 관련 연구
4. 서열 정렬
5. 다중 서열 정렬
6. 대표 문자열 변환 및 유사도 계산 기법
7. 실험 및 결과
8. 결론 및 추후 연구
참고문헌

참고문헌 (9)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-ECN-0101-2014-569-000471159