이 글은 입법평가 영역에 인공지능을 활용할 수 있는지를 모색한다. ChatGPT 열풍이 시사하는 것처럼 현재 인공지능이 보여 주는 기술적 수준이나 역량은 놀라울 정도이다. 언어적 소통 영역에 한정해 말하면 이제 인공지능은 인간처럼 소통하는 것에 머물지 않고 의료나 행정, 사법, 면접 등과 같이 전문적인 역량이 필요한 영역에서도 상당한 성취를 보여 준다. 이에 인공지능이 인간이 수행하던 전문 영역을 대체할 것이라는 두려움이 현실적 위험으로 엄습한다. 이러한 상황에서 이 글은 의료나 행정, 사법, 면접처럼 고도의 전문적 역량이 요청되는 입법평가에도 인공지능을 활용할 수 있는지, 만약 가능하다면 그 범위는 어떻게 획정할 수 있는지, 이에 따른 한계는 무엇인지 살펴본다. 이를 위해 먼저 입법평가가 어떤 의미를 지니는지(II), 이러한 입법평가를 수행하는 데 필요한 역량은 무엇인지 규명한다(III). 다음으로 인공지능이 현재 도달한 기술 수준을 검토함으로써 입법평가를 수행하는 데 필요한 역량을 인공지능이 갖추고 있는지 살펴본다(IV). 이어서 실제로 인공지능이 입법평가에 활용될 수 있는지를 검증한다는 차원에서 의료, 사법, 행정, 면접 영역에서 인공지능이 어떻게 활용될 수 있는지 또는 활용되는지를 살펴본다(V). 이를 토대로 하여 입법평가 가운데 어떤 영역에서 인공지능을 활용할 수 있는지, 이때 필요한 추가적인 근거와 요건은 무엇인지 검토한다(VI). 이 글은 다음과 같은 결론에 도달한다. 지금의 기술적 수준을 고려할 때 입법평가에 인공지능을 활용할 가능성은 분명 존재한다. 그러나 이는 양적 평가와 같은 영역에만 제한적으로 활용되어야 한다. 더불어 인공지능이 내놓은 입법평가 결과를 인간 전문가가 검증할 수 있도록 거버넌스를 구축하고 법적 근거도 확보해야 한다. 인공지능은 재량 영역처럼 고도로 복잡한 사고 능력을 발휘해야 하는 영역에서 여전히 불완전함을 보여 주기 때문이다. ChatGPT가 범하는 환각(hallucination) 이슈가 예증하듯이 인공지능은 인간이 수행하던 전문적 영역을 완전하게 대체하기에는 부족하다. 이는 입법평가에도 마찬가지라고 말할 수 있다.
This article explores whether artificial intelligence can be used in the area of legislative evaluation. As the ChatGPT is showing, the technological level and capabilities currently shown by artificial intelligence are astonishing. In the area of linguistic communication, artificial intelligence is now not only communicating like humans, but also is showing professional achievements in areas that require professional capabilities, such as medical care, administration, judicial decision making and interviews. As a result, the fear that artificial intelligence will replace the professional field performed by humans is now becoming a real risk. In that situation, this article examines whether artificial intelligence can be used for legislative evaluation that requires high professional competence, such as medical, administrative, judicial and interview, and if so, how the scope can be defined, and what limitations there are. To this end, this article first identifies what legislative evaluation means (II) and what capabilities are required to carry out such legislative evaluation (III). Next, by examining the level of technology AI has reached at present, it is examined whether AI has the necessary capabilities to conduct legislative evaluation (IV). Then, in order to verify whether artificial intelligence can actually be used for legislative evaluation, this article handles the question of how artificial intelligence can or is used in the medical, judicial, administrative and interview areas (V). Based on this, it is reviewed in which areas artificial intelligence can be used during legislative evaluation and what additional requirements are necessary for this (VI). This article reaches the following conclusions. Considering the current technological level, there is a clear possibility of using artificial intelligence for legislative evaluation. However, this should be limited to areas such as quantitative evaluation. In addition, governance and legal institutions must support that human experts can verify the legislative evaluation results presented by artificial intelligence. This is because artificial intelligence still shows imperfections in areas that require highly complex thinking skills, such as the realm of discretion. As the hallucination issue of ChatGPT exemplifies, artificial intelligence is not enough to completely replace human specialized domains. The same can be said for legislative evaluation.