메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

이동엽 (세종대학교, 세종대학교 대학원)

지도교수
나중채
발행연도
2022
저작권
세종대학교 논문은 저작권에 의해 보호받습니다.

이용수6

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (3)

초록· 키워드

오류제보하기
최장 공통 부분 서열(Longest Common Subsequence, LCS)은 서열의 유사도(similarity)를 나타내는 주요 지표 중 하나로 사용되며, 일반적으로 두 문자열의 LCS를 구하는 데는 문자열 길이의 곱에 비례하는 시간이 필요하다. 극대 공통 부분 서열(Maximal Common Subsequence, MCS)은 최장(longest) 조건을 극대(maximal)로 완화하여 어떤 문자라도 추가하면 더 이상 공통 조건을 만족시키기 못하는 공통 서열로, 두 문자열의 MCS를 선형에 가까운 시간에 찾는 알고리즘이 최근 제시되었다. 두 문자열의 MCS의 길이는 LCS의 길이와 달리 유일하지 않을 수 있으며, LCS의 길이가 매우 길더라도 길이가 1인 MCS가 존재할 수 있다. 따라서 MCS의 유사도로서의 효용성은 어떤 MCS를 찾는지에 따라 달라진다.
본 논문에서는 첫째, 기존 알고리즘으로 구한 MCS의 효용성을 다양한 실제 데이터와 랜덤으로 생성한 데이터에 대한 실험을 통해 분석한다. MCS의 길이는 LCS 길이 대비 실제 데이터에서는 15.5~58.0%, 랜덤 데이터에서는 12.6~55.3%로 나타났고, MCS의 길이와 LCS의 길이의 상관 관계도 높지 않았다. 둘째, 기존 알고리즘을 개선하여 더 긴 MCS를 찾는 두 가지 알고리즘 (알고리즘 A, 알고리즘 P)을 제시한다. 알고리즘 A는 기존의 MCS 알고리즘에서 공통 문자를 찾는 순서를 변경하는 전략을 사용하고, 알고리즘 P는 공통 문자를 한 번에 한 쌍 처리하는 전략을 사용한다. 개선 알고리즘은 기존 알고리즘 대비 실제 데이터에서는 1.47~3.17배, 랜덤 데이터에서는 1.5~3.08배 길이의 MCS를 찾았다.

목차

I. 서론 10
II. 배경지식 14
1. 최장 공통 부분 서열 (LCS) 14
2. 극대 공통 부분 서열 (MCS) 16
III. 극대 공통 부분 서열(MCS)의 효용성 17
1. 실험 설정 17
2. MCS와 LCS의 길이 차이 19
2. 1. 실제 데이터 20
2. 2. 랜덤 데이터 22
3. MCS와 LCS 길이의 상관 관계 24
3. 1. 실제 데이터 24
3. 2. 랜덤 데이터 25
4. LCS와 MCS의 시간 비교 27
IV. 개선 알고리즘 28
1. 기존 MCS 알고리즘 28
2. 개선 알고리즘 A 31
3. 개선 알고리즘 P 32
4. 실험 및 분석 33
4. 1. 길이 비교 34
4. 1. 1. 실제 데이터 34
4. 1. 2. 랜덤 데이터 37
4. 2. 여러 쌍의 문자를 검사하는 알고리즘 P의 길이 차이 42
V. 결론 45
참고문헌 47

최근 본 자료

전체보기

댓글(0)

0