메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
저널정보
SK텔레콤 Telecommunications Review Telecommunications Review 제14권 제1호
발행연도
2004.1
수록면
123 - 134 (12page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
본 논문에서는 인위적으로 조절되지 않은 조명하에서 영상특징을 정확히 추출하고 음성과 영상정보를 효과적으로 통합하는 새로운 바이모달(bimodal) 음성인식 시스템을 제안한다. 영상특징 추출과정에서는 영상에서의 불균일한 조 명을 보상한 후 여러 형태의 컬러영상으로부터 입술의 윤곽을 추출하며 이를 통해 입술의 모양에 관한 정보와 입안의 컬러 정보로 영상특징을 표현한다. 음성특징 추출과정에서는 MFCCs(Mel-Frequency Cepstral Coefficients)를 추출한다. 음성과 영상특징의 인식기로는 모두 은닉 마코프 모델(HMMs: Hidden Markov Models)을 사용한다. 영상정보와 음성정보의 통합은 후기통합모델에 기반하며, 음성신호의 잡음수준을 추정하여 영상과 음성정보간의 최적가중치를 결정하는 두 가지 방법을 제시한다. 화자의존 고립단어 숫자인식 실험을 통해, 제안된 영상특징 추출방식이기존의 변형가능한 템플(deformable template) 방법보다 우수함을 보이며, 잡음환경에서 바이모달 시스템으로 최대 12%의 인식율 향상을 얻을 수 있음을 보인다.

목차

등록된 정보가 없습니다.

참고문헌 (16)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0