메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학위논문
저자정보

김범준 (배재대학교, 배재대학교 일반대학원)

지도교수
이경희
발행연도
2023
저작권
배재대학교 논문은 저작권에 의해 보호받습니다.

이용수28

표지
AI에게 요청하기
추천
검색

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
동작인식 기술은 카메라나 센서를 활용하여 사람의 움직임을 이해하는 기술이다. 기존의 동작인식 기술로는 적외선 센서나 열감지 센서를 활용한 깊이 데이터를 통해 움직임을 처리하거나 웨어러블 디바이스 같은 신체 부착 센서를 활용한 위치, 움직임 정보를 처리하는 방식이 있다. 최근에는 일반 카메라로 촬영한 비디오 내의 사람 움직임을 딥러닝 기술로 해석하여 동작에 대한 해석을 제공하는 연구가 많아지고 있다. 딥러닝을 활용한 동작인식은 신체의 움직임뿐만 아니라 얼굴 표정, 손 모양과 같은 신체의 세부적인 정보에 대해서도 제공해주고 있다. 기존의 딥러닝을 활용한 동작인식으로 CNN(Convolution Neural Network)과 RNN(Recurrent Neural Network) 구조를 활용한 CRNN의 비디오 데이터 해석을 가장 쉽게 찾아볼 수 있다. CNN을 활용한 방식은 동작의 특징과 매칭 정보를 전부 컴퓨터 스스로 수행하기 때문에 CNN이 생성한 특징 정보를 사람이 해석하고 활용하기에는 다소 어려움이 존재한다.
본 논문에서는 이미지 데이터 해석 과정에 대한 특징 추출과 매치에 기존의 CNN 알고리즘을 활용하는 방식에서 사람의 자세를 정확히 파악할 수 있는 신체 핵심좌표 데이터 생성 방식을 활용하여 사람의 동작을 해석할 수 있는 시스템을 설계 및 구현하였다.
본 논문에서는 동작인식 기술로 수어 동작에 대한 인식 연구에 대해 기술한다. 수어 문장에서 수어 낱말을 분리하고 인식 정보를 제공하는 방법을 기술한다. 또한 신체 핵심좌표 데이터 추출을 통한 모션 벡터 생성을 통해 수어 인식에 대한 성능을 높이는 연구에 대해 기술한다. 수어 인식에 대한 성능 확인으로는 수어 인식(추론)에 걸리는 시간과 수어 인식 모델 생성에 필요한 훈련시간을 측정하였다. 그리고 수어 낱말 길이(프레임) 추론에 대한 정확도를 확인하였으며 수어 인식의 추론 신뢰도 값을 제시한다.
본 논문을 통해 제안한 수어 인식 모델의 성능 확인을 위해 수어의 요소인 수형의 차이가 나는 수어부터 수향, 수위, 비수지기호에 따라 그 의미가 달라지는 수어들을 발화 시간이 다른 20개의 영상으로 준비해 학습하고 인식을 진행하였다. 실험 결과로 CNN을 활용한 수어 인식 모델에서 비수지기호로 분류할 수 있는 수어를 인식할 때 오답을 추론하는 것을 확인할 수 있었으며, 신체 핵심좌표를 활용한 수어 인식 모델은 수어의 요소에 대한 차이에 상관없이 모두 정답을 추론하는 결과를 보였다. 국립국어원에서 조사한 사용빈도수에 따른 상위 50개의 단어에 해당하는 수어를 학습 데이터로 하여 수어 인식을 진행하였을 때는 모두 오류 없이 정답을 추론하였으며, CNN을 활용한 수어 인식 모델은 약 59.04%의 추론 신뢰도를 보였고 핵심좌표를 활용한 수어 인식 모델은 약 78.91%의 추론 신뢰도를 보였다. 향후 신체 핵심 좌표를 활용한 수어 인식 시스템으로 사람의 움직임을 인식하는 것에 대한 정확성 및 효율성을 제공하여 사람의 여러 동작들에 대한 해석 및 처리에 널리 활용 될 수 있을 것으로 판단된다.

목차

국문초록 ···································································· ⅰ
목 차 ···································································· ⅲ
그림목차 ···································································· ⅵ
도표목차 ···································································· ⅸ
약 어 표 ···································································· ⅹ
Ⅰ. 서 론 ·················································· 1
1.1 연구 배경 및 목적 ························································ 1
1.2 연구 내용 및 범위 ························································ 2
1.3 논문의 구성 ······························································ 3
Ⅱ. 관련연구 ············································ 4
2.1 수어 인식 기술 연구 ··············································· 4
2.1.1 지문자 인식 ······················································· 4
2.1.2 수화 인식 ······················································· 4
2.2 Neural Network ············································· 5
2.3 인공신경망을 이용한 이미지 인식 ···························· 6
2.3.1 Convolution Neural Network ···························· 6
2.3.2 LeNet ························································· 7
2.3.3 CNN 신경망 구조 ················································· 9
2.4 시계열 데이터를 학습하기 위한 인공신경망 ···················· 13
2.4.1 Recurrent Neural Network ·································· 13
2.4.2 Long Short Term Memory ·································· 15
2.5 신체 핵심좌표(Keypoint)를 추정하기 위한 연구 ··················· 20
2.5.1 MediaPipe ················································· 20
2.5.2 Openpose ·················································· 24
2.5.3 YOLO v7 pose ············································ 26
2.6 자연어 ························································ 28
2.6.1 자연어에 대한 해석 ······································ 28
2.6.2 문어에 대한 해석 ········································· 29
2.6.3 구어에 대한 해석 ········································· 30
2.6.4 수어(수화)에 대한 해석 ··································· 31
Ⅲ. 수어 인식을 위한 문제정의 ··················· 34
3.1 한국 수화 언어 ··················································· 34
3.1.1 수어의 손 모양(수향) ····································· 34
3.1.2 수어의 손 움직임(수동) ····································· 35
3.1.3 수어의 손 위치(수위) ····································· 36
3.1.4 수어의 손바닥 방향(수향) ··································· 37
3.1.5 손 동작 및 모형 이외의 수어 요소(비수지기호) ·············· 38
3.2 수어 문장 인식에 대한 문제 ································ 39
3.3 수어 낱말 길이 추론 ··································· 40
3.3.1 수어 낱말 분리 ·················································· 40
3.3.2 서로 다른 길이의 수어 낱말 추론 ································· 41
3.4 신경망을 활용한 수어 인식 ··································· 42
Ⅳ. 수어 인식 시스템 설계 ························ 44
4.1 비디오 입력 모듈 ····································· 45
4.2 비디오 분할 모듈 ····································· 46
4.3 입력 데이터 전처리 모듈 ···························· 47
4.4 수어 추론 모듈 ···································· 50
4.5 시계열 데이터 학습 동작 절차 ························· 51
4.6 수어 인식(추론) 신뢰도 반복 평가 과정 ························· 54
Ⅴ. 실험 및 성능분석 ······························ 56
5.1 실험 환경 ·········································· 56
5.2 핵심좌표 데이터 활용에 따른 학습 결과 비교 ········ 57
5.2.1 사용빈도수 최상위 수어 낱말 50개 인식 결과 비교 ···· 58
5.2.2 수형 차이의 수어 낱말 인식 결과 비교 ············· 62
5.2.3 수위 차이의 수어 낱말 인식 결과 비교 ············· 65
5.2.4 수향 차이의 수어 낱말 인식 결과 비교 ············· 67
5.2.5 비수지기호를 포함하는 수어 동작 인식 결과 비교 ···· 70
Ⅵ. 결론 및 향후 연구 방향 ··························· 73
참고문헌 ··································································· 75
Abstract ··································································· 80
감사의 글(Acknowledgement) ·············································· 89
<부록 1> 수어 추론을 위한 인식 구간 조정 ······························· 83
<부록 2> MediaPipe를 활용한 모션 벡터 생성 ····························· 84
<부록 3> 모션 벡터 생성을 위한 비디오 프레임 셋 생성 ··················· 85
<부록 4> 수어 인식(추론) 및 재추론 판단 과정 ····························· 86
<부록 5> CNN과 LSTM을 활용한 비디오 인식 기계학습 ··················· 87
<부록 6> 모션 벡터를 활용한 비디오 인식 기계학습 ························ 88

최근 본 자료

전체보기

댓글(0)

0