메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
저널정보
한국일본언어문화학회 일본언어문화 일본언어문화 제22호
발행연도
2012.1
수록면
187 - 205 (19page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
大量の発話・発話場面データにもとづいて話者の言語運用の実態が調べられる 対談番組のマルチメディア・コーパス を、今後より多面的な分析に活用するため、コーパスにおける40時間分の音声文字化テキストをβ単位に分類し単位ごとに見出し語・品詞・語種を付与・搭載したが、その際、本来書きことばの解析のために開発された形態素解析プログラムを用いたことから、大量の誤解析が発生した。用いたプログラムは形態素解析システム用の日本語辞書“UniDic(1.3.12)”とオープンソース形態素解析エンジン“MeCab(0.993)”である。そして、その解析結果の精密度を測るためにサンプリング調査を行ったところ、β単位への分類及び各種の言語情報の付与は約97.52%の精密度で自動的に解析できるということ、その精密度は対談番組の対談形式によって大きく異なるということ、誤解析は主として「終助詞・間投助詞」「擬音語・擬態語」「感情表出表現」「未登録語(固有名詞・方言など)」「語形変化が伴った語」「非語彙的な母音・子音の拡張及び縮約が伴った語」のいずれかの言語項目において頻出するということなどが明らかになった。このように誤解析のパターンを今後とも精密に記述していけば、話しことばに十全に対応できる形態素解析プログラムの開発や、誤解析の発生を軽減させながら大量かつ精密に音声を文字化する方法論の模索にもつながると考える。

목차

등록된 정보가 없습니다.

참고문헌 (25)

참고문헌 신청

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0