지원사업
학술연구/단체지원/교육 등 연구자 활동을 지속하도록 DBpia가 지원하고 있어요.
커뮤니티
연구자들이 자신의 연구와 전문성을 널리 알리고, 새로운 협력의 기회를 만들 수 있는 네트워킹 공간이에요.
이용수2
제1장 서론 1제2장 편집거리 32.1. 용어정리 32.2. 문제정의 32.3. D-테이블 42.4. 4-러시안 알고리즘 6제3장 GPGPU 113.1. GPGPU의 개요 113.2. CUDA의 구조 133.3. CUDA 프로그래밍 모델 153.4. CUDA 프로그래밍 18제4장 4-러시안 알고리즘의 병렬계산 214.1. 데이터 종속성 214.2. 병렬 알고리즘 23제5장 실험 결과 및 분석 275.1 전처리 단계의 수행 결과 285.2 계산 단계의 수행 결과 29제6장 결론 31참고 문헌 32그림 목차[그림 2-1] 편집연산 4[그림 2-2] X = ababca와 Y = abcacdcac에 대한 D-테이블 5[그림 2-3] t = 3일 때, 4-러시안 알고리즘으로 계산한 편집거리 6[그림 2-4] 전처리된 룩업테이블을 사용한 4-러시안 계산 7[그림 2-5] 편집거리 값의 변환 8[그림 2-6] 룩업테이블 생성 ( = {a,b,.,z}, t = 4) 9[그림 3-1] CPU와 GPU에 대한 부동소수점 연산 12[그림 3-2] CPU와 GPU에 대한 메모리 대역폭 12[그림 3-3] 다양한 언어와 응용프로그램 프로그래밍 인터페이스를 지원하도록 설계된 CUDA 13[그림 3-4] 페르미 스트리밍 멀티프로세서 구조 14[그림 3-5] 듀얼 워프 스케줄러 구조 15[그림 3-6] CUDA의 쓰레드 계층구조 16[그림 3-7] CUDA의 메모리 계층구조 17[그림 4-1] D-테이블의 데이터 종속성 21[그림 4-2] 4-러시안 알고리즘의 데이터 종속성 22[그림 4-3] 4-러시안 알고리즘의 병렬화 방법 22[그림 4-4] 4-러시안 병렬 알고리즘을 이용한 편집거리 계산 23[그림 5-1] 블록 크기에 따른 수행시간 28[그림 5-2] C4R과 G4R의 성능 비교 (t=1, 1,000 <= m,n <= 10,000) 29[그림 5-3] C4R과 G4R의 성능 비교 (t=2, 1,000 <= m,n <= 10,000) 30표 목차[표 5-1] 실험 환경 27[표 5-2] t에 따른 룩업테이블의 메모리 크기 28
0