최근 대한민국의 극심한 저출산으로 인한 산업현장 인력난 해결을 위해 외국인 노동인력 도입이 확대되면서, 이와 관련된 고용정책, 이주민 정착지원, 내국인과의 갈등, 다문화 가정 등 다양한 방면에서 논의가 이뤄지고 있다. 본 연구는 국내 언론사의 뉴스 기사를 텍스트마이닝 기법으로 분석하여 이주노동자와 관련한 주요 이슈들이 무엇인지 정량적으로 파악하고, 언론이 이러한 쟁점들을 어떠한 긍・부정의 정서적 어조로 기술하였는지 살펴보았다. 이를 위해, 관련 뉴스 기사들을 크롤링한 후, 키워드 빈도분석, 토픽모델링 및 단어기반 감성분석을 수행하였다. 키워드 빈도분석 결과 ‘고용’, ‘센터’, ‘정부’, ‘주민’, ‘임금’ 등이 최상위 키워드로 나타났으며, 토픽모델링 분석 결과 ‘지역센터 및 의료지원’, ‘주거환경 실태 및 개선’, ‘계절 및 가사노동 정책’, ‘결혼이주여성 및 고용제도’, ‘산업재해 및 차별’ 등이 주요 이슈로 도출되었다. 감성분석 결과, 다섯 개의 토픽들 중에서 ‘지역센터 및 의료지원’과 관련된 뉴스 기사들에 긍정적인 어조가 가장 높게 나타난 반면, ‘결혼이주여성 및 고용제도’ 토픽으로 분류된 뉴스 기사들이 가장 부정적인 논조로 기술된 것으로 나타났다. 이러한 연구는 우리사회가 숙의해야 할 의제들이 무엇인지 명료하게 파악하는 데 공헌할 수 있으며, 또한 언론사의 공정한 시각과 태도를 촉매하여 균형 있는 여론을 형성하는 데 기여할 수 있을 것으로 기대된다.
The purpose of this study is to identify the main issues related to migrant workers covered in South Korean news articles and analyze the emotional tone in which the media addresses these issues. The study has three specific research objectives. First, it examines the most frequently appearing words in domestic news articles related to migrant workers to identify key keywords. Second, it extracts the main topics covered in news articles related to migrant workers to understand the contentious issues. Lastly, it analyzes the positive and negative tones of news articles on each topic to discern the media’s perspective on these issues. For this research, 1,025 articles published by 96 media outlets from January 2020 to September 2023 were collected using web crawling techniques. After that, term frequency analysis, and LDA topic modeling were performed using Python coding and dictionary-based sentiment analysis was conducted using text analysis tool LIWC (Linguistic Inquiry and Word Count)-22. Additionally, to utilize LIWC22, which performs analysis based on English words, a deep learning-based translation software DeepL was also used to translate the Korean articles into English before applying LIWC. The results revealed that ‘employment’, ‘center’, ‘government’, ‘resident’, and ‘wage’ were among the top keywords related to migrant workers. Topic modeling analysis identified ‘local centers and medical support’, ‘housing conditions and improvements’, ‘seasonal and domestic labor policies’, ‘marriage migrant women and employment systems’, and ‘industrial accidents and discrimination’ as the main issues. Lastly, the sentiment analysis showed that news articles related to ‘local centers and medical support’ were described in the most positive tone, while those classified under the topic of ‘conflicts over marriage migrant women and employment systems’ were described in the most negative tone. This research can contribute to clearly identifying the agendas that our society needs to consider and may also encourage media fairness and balance, contributing to the formation of a balanced public opinion.