메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술저널
저자정보
신철완 (동의대학교) 김화선 (동의대학교)
저널정보
한국정보통신학회 한국정보통신학회논문지 한국정보통신학회논문지 제29권 제1호
발행연도
2025.1
수록면
26 - 33 (8page)
DOI
10.6109/jkiice.2025.29.1.26

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

초록· 키워드

오류제보하기
본 논문에서는 AI를 기반으로 멀티미디어 데이터에서 텍스트 정보를 추출하고 변환하는 애플리케이션의 개발 및 그 평가에 대해 다룬다. 애플리케이션은 Google ML Kit의 텍스트 인식 기능과 네이버 CLOVA Speech Recognition API의 음성 인식 기술을 활용하여 사용자가 촬영 또는 녹음한 데이터로부터 텍스트를 추출한다. 추출된 텍스트에는 ChatGPT API를 통해 맞춤법 수정, 번역 등 다양한 텍스트 변환 기능을 수행할 수 있다. 애플리케이션의 성능 평가는 CER(Character Error Rate)을 지표로 타 애플리케이션과의 비교를 통해 이루어졌다. 또한 평가 결과를 바탕으로 딥러닝 기반의 Wave-U-Net모델을 이용한 노이즈 제거 기술 등이 데이터 처리 성능의 개선에 도움을 주는지 테스트하였다. 이를 통해 다양한 AI 기술이 실제 환경에서 데이터 추출 및 가공의 효율성을 어떻게 향상시킬 수 있는지 확인할 수 있었으며, 이러한 연구 결과는 향후 다양한 분야에서 데이터 처리의 자동화와 정확도 향상에 기여할 것으로 기대된다.

목차

요약
ABSTRACT
Ⅰ. 서론
Ⅱ. 애플리케이션 흐름도 및 구성
Ⅲ. 생성형 AI의 활용
Ⅳ. 주요 기능 평가
Ⅴ. STT 기능 성능 개선
Ⅵ. 결론
REFERENCES

참고문헌 (0)

참고문헌 신청

함께 읽어보면 좋을 논문

논문 유사도에 따라 DBpia 가 추천하는 논문입니다. 함께 보면 좋을 연관 논문을 확인해보세요!

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0

UCI(KEPA) : I410-151-25-02-092246626