이 연구는 ‘생물교과논리 및 논술’ 수업에서 실시된 논증글쓰기에 대한 동료평가와 자기평가, 교수자 평가 간 상관관계를 분석하는 것이다. 이를 위해 14명의 예비 생물교사들이 네 차례에 걸쳐 논증글쓰기를 하였고, 이 결과물들을 대상으로 동료평가와 자기평가, 교수자 평가가 이루어졌다. 논증글쓰기에 대한 동료평가는 평균 2.70점이었고, 자기평가 평균은 2.68점, 교수자 평가 평균은 2.71점이었다. 하위 평가 영역별 평균을 살펴보면 동료평가에서는 과학지식이 가장 높았고, 자기평가에서는 구성 영역이 가장 높았다. 또한 교수자 평가에서는 과학지식 영역이 가장 높았다. 표준편차를 살펴본 결과 자기평가의 표준편차가 가장 크게 나타났다. 평가 유형 간 상관관계를 분석한 결과 동료평가와 교수자 평가 간에는 높은 상관관계를 보였고, 자기평가와 교수자 평가 간에는 보통의 상관관계를 나타냈다. 반면에 동료평가와 자기평가 간에는 유의미한 상관관계가 나타나지 않았다. 평가 영역별 상관관계를 분석한 결과에서는 동료평가와 자기평가 간에는 과학 지식, 과학 논증, 구성, 표현의 네 영역에서 모두 유의미한 상관관계가 나타나지 않았다. 또한 동료평가와 교수자 평가 간 분석에서는 과학 지식, 과학 논증, 구성 영역에서 유의미한 상관관계가 나타났다. 또한 자기평가와 교수자 평가 간에는 표현 영역에서만 유의미한 상관관계를 보였다. 이 연구의 결과는 ‘교과논리 및 논술’ 수업에서 동료평가의 적용 가능성이 높음을 보여주는 것이다. 또한 동료평가와 자기평가를 활용하기 위해서는 평가 유형에 따른 평가 기준 세분화가 필요함을 시사하고 있다.
This study analyzed correlation among peer evaluation, self-evaluation, and instructor evaluation of argumentation writing conducted in the 'Biology logic and essay' class. To this end, 14 pre-service biology teachers wrote argumentation four times, and peer evaluation, self-evaluation, and instructor evaluation were conducted on these results. The peer evaluation for argumentation writing averaged 2.70 points, the self-evaluation average was 2.68 points, and the instructor evaluation average was 2.71. Looking at the average of each sub-evaluation area, scientific knowledge was the highest in peer evaluation, and the composition area was the highest in self-evaluation. In addition, the area of scientific knowledge was the highest in the instructor evaluation. As a result of examining the standard deviation, the standard deviation of self-evaluation was the largest. As a result of analyzing the correlation between evaluation types, there was a high correlation between peer evaluation and instructor evaluation, and there was a moderate correlation between self-evaluation and instructor evaluation. On the other hand, there was no significant correlation between peer evaluation and self-evaluation. As a result of analyzing the correlation by evaluation area, there was no significant correlation between peer evaluation and self-evaluation in all four areas of scientific knowledge, scientific argumentation, composition, and expression. On the other hand, in the analysis between peer evaluation and instructor evaluation, there was a significant correlation in the areas of scientific knowledge, scientific argumentation, and composition. In addition, there was a significant correlation between self-evaluation and instructor evaluation only in the area of expression. The results of this study show that peer evaluation is highly likely to be applied in the 'Subject logic and essay' class. It also suggests that it is necessary to subdivide evaluation criteria according to the type of evaluation in order to use peer evaluation and self-evaluation.