메뉴 건너뛰기
.. 내서재 .. 알림
소속 기관/학교 인증
인증하면 논문, 학술자료 등을  무료로 열람할 수 있어요.
한국대학교, 누리자동차, 시립도서관 등 나의 기관을 확인해보세요
(국내 대학 90% 이상 구독 중)
로그인 회원가입 고객센터 ENG
주제분류

추천
검색

논문 기본 정보

자료유형
학술저널
저자정보
저널정보
한국일본언어문화학회 일본언어문화 일본언어문화 제23호
발행연도
2012.1
수록면
163 - 184 (22page)

이용수

표지
📌
연구주제
📖
연구배경
🔬
연구방법
🏆
연구결과
AI에게 요청하기
추천
검색

초록· 키워드

오류제보하기
本稿は、近代日本語文献を電子化する際に、どの符号化文字集合に依拠するのが現状では最も適切かを検討した。具体的には、JIS X 0208に依拠して作成された「太陽コーパス」を、JIS X 0213及びUnicode 4.0で再符号化処理を行い、カバー率と稼働率を算定した。カバー率は、のべ字数ではJIS X 0208:99.79%、JIS X 0213:99.93%、Unicode 4.0:99.93%となり、異なり字数ではJIS X 0208:79.58%、JIS X 0213:92.02%、Unicode 4.0:98.49%となり、約6,800字集合のJIS X 0208よりも約11,000字集合のJIS X 0213、JIS X 0213よりも約70,000字集合のUnicode 4.0と、集合の規模が大きくなればなるほど、カバー率が高くなり、有用な符号化文字集合と言える。一方稼働率は、JIS X 0208:約87%、JIS X 0213:約62%、Unicode 4.0:約11%となり、集合の規模が大きくなればなるほど、集合の中で稼働する文字の割合が低くなり、電子化する際のコストの増大が見込まれる。JIS X 0208は稼働率の面で低コストであるがカバー率の面で不足し、Unicode 4.0はカバー率の面で優れているが稼働率の面でコストが高い。カバー率と稼働率の双方を勘案すると、現状ではJIS X 0213の11,000字集合が、近代日本語文献の電子化に適しているという結論を得た。

목차

등록된 정보가 없습니다.

참고문헌 (10)

참고문헌 신청

이 논문의 저자 정보

최근 본 자료

전체보기

댓글(0)

0