디지털 기반 지능 정보 사회로의 진입에 발맞추어 과학 교육과정에서는 과학과의 교과역량 함양을 강조하고 있으며, 역량 평가의 측면에서 컴퓨터 기반 평가가 관심을 받고 있다. 컴퓨터 기반 평가는 높은실제성을 갖는 형태로 문항을 구현할 수 있고, 평가 결과를 데이터베이스로 축적하여 환류 체계를 구축함에 있어서도 이점이 있다. 다만, 평가 타당도 개선, 측정 효율성 저하, 관리 요소 증가 등의 문제를해결할 필요가 있다. 본 연구에서는 학업성취도 평가가 지필평가에서컴퓨터 기반 평가로 전환되는 과정에서 새로운 평가의 도입에 따른학생들의 반응을 살펴보기 위해 2021년도에 시행된 학업성취도 평가의 지필평가와 컴퓨터 기반 평가의 병행시행 결과를 분석하였다. 특히, 동일한 문항을 평가 매체만을 변화시켰을 때 학생들의 성취에미치는 영향, 컴퓨터 기반 평가의 장점을 살린 새로운 기능을 포함하여 문항을 구성했을 때의 변화가 학생들의 성취에 미치는 영향을 살펴보았다. 중학교 3학년 학생 7,137명이 지필평가와 2종의 컴퓨터기반 평가 중 하나에 응시한 결과를 분석하였다. 평가 시행 후 집단별로 문항의 정답률과 변별도 평균을 산출하였으며, 학업성취도 출제경험이 있는 과학교사 8명이 참여한 전문가 협의회를 통해 응답 특성에 대한 전문가 의견을 수렴하였다. 결과에 따르면 지필평가와 단순모드 전환형 평가에서의 학생들의 성취 결과는 큰 차이는 없어 매체효과가 거의 나타나지 않았다. 다만, 서답형 문항의 정답률이 컴퓨터기반 평가에서 다소 높게 나타났음을 확인하였고, 이는 응답의 편이성과 관련되는 것으로 분석하였다. 한편, 컴퓨터 기반 평가 도입에따라 새로운 기능들이 적용된 문항들에서 유사한 문항의 정답률과차이가 10%p 이상인 문항들이 존재하였다. 학생들의 답지 반응을분석한 바에 따르면, 이는 새로운 기능을 통해 마련한 혁신적인 문항들이 학생들의 이해 수준을 보다 세밀하게 파악한 결과로 볼 수 있었다. 결과를 토대로 컴퓨터 기반 평가를 도입하고 개발할 때 유의할사항을 논의하고 시사점을 제시하였다.
In line with the entry into the digital-based intelligent information society, the science curriculum emphasizes the cultivation of scientific competencies, and computer-based test (CBT) is drawing attention for assessment of competencies. CBT has advantages to develop items that have high fidelity, and to establish a feedback system by accumulating results into the database. However, it is necessary to solve the problems of improving validity of assessment results, lowering measurement efficiency, and increasing management factors. To examine students’ responses to the introduction of the new assessment tools in the process of transitioning from paper-based test (PBT) to CBT, in this study, we analyzed the results of the PBT and the CBT conducted in 2021 National Assessment of Educational Achievement (NAEA).
In particular, we sought to find the effects on student achievement when only the mode of assessment was changed without change of items, and the effect on student achievement when the items were composed including technology enhanced features that take advantage of CBT. This study is derived through the analysis of the results of 7,137 third-grade middle school students taking one among the three kinds of assessments, which were the PBT or two kinds of CBT. After the assessment, the percentage of correct answers and the item discriminations were collected for each group, and expert opinions on characteristics of response were collected through the expert council involving 8 science teachers with experience in NAEA. According to the results, there was no significant difference between students’ achievement results in the PBT and the CBT-M, which means simple mode conversion type of CBT, so it could be explained that the mode effect did not appear. However, it was confirmed that the percentage of correct answers for the construct response items was somewhat high in the CBT, and this result was analyzed to be related to the convenience of the response. On the other hand, there were the items with a difference of more than 10%p from the correct answer rate of similar items, among the items to which technology enhanced functions were applied following the introduction of CBT. According to the analysis of response rate of options, these results could be explained that the students’ level of understanding could be more closely grasped through the innovative items developed through the technology enhanced function. Based on the results, we discussed some guidance to be considered when introducing CBT and developing items through CBT, and presented implications