메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색
질문

논문 기본 정보

자료유형
학술대회자료
저자정보
정의석 (한국전자통신연구원) 전형배 (한국전자통신연구원) 이윤근 (한국전자통신연구원)
저널정보
한국HCI학회 한국HCI학회 학술대회 HCI 2012
발행연도
2012.1
수록면
419 - 420 (2page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색
질문

이 논문의 연구 히스토리 (2)

초록· 키워드

오류제보하기
음성 워드프로세서를 위한 한국어 딕테이션 시스템 개발은 대용량 언어모델을 기반으로 구축된다. 본 논문은 해당 언어모델 구축을 위한 텍스트 코퍼스 수집 및 정제에 대한 절차 및 방법에 대하여 기술한다. 텍스트 코퍼스 수집은 일반적으로 어플리케이션 도메인에 의존하고 있으나, 음성 워드프로세서의 경우 특정 도메인이 없다는 문제점이 있다. 따라서, 기본 보유한 텍스트 코퍼스 및 관련 업체로부터 수집 그리고, 웹으로부터 크롤링을 통하여 텍스트 코퍼스를 구축하였다. 정제기술은 웹문서 노이즈 제거와 언어^_@span style=color:#999999 ^_# ... ^_@/span^_#^_@a href=javascript:; onclick=onClickReadNode('NODE01878197');fn_statistics('Z354','null','null'); style='color:#999999;font-size:14px;text-decoration:underline;' ^_#전체 초록 보기^_@/a^_#

목차

등록된 정보가 없습니다.

참고문헌 (0)

참고문헌 신청

이 논문의 저자 정보

이 논문과 함께 이용한 논문

최근 본 자료

전체보기

댓글(0)

0