초록 열기/닫기 버튼

본 연구는 국내의 대표적 포털 사이트인 네이버에서 뉴스기사의 악성댓글을 탐지하고 걸러내기 위한 목적으로 개발한 인공지능 서비스 ‘클린봇’이 혐오표현을어떻게 판별하는가를 분석했다. 그리고 온라인 혐오의 대상을 성소수자, 여성, 외국인으로 상정하고 각 대상이 다뤄지는 기사의 댓글에서 ‘클린봇’이 혐오표현을 악플로 탐지하는 양상을 비교했다. 이를 위해, 혐오표현을 낙인 이론에기초해 라벨링, 스테레오타이핑, 분리하기, 조롱하기, 단순욕설의 다섯가지유형으로 구분하고 각 유형의 혐오댓글이 악플 판별의 결과에 따라 어떻게 나타나는지 살펴보았다. 그 결과, ‘클린봇’은 단순욕설과 라벨링에 해당하는 혐오댓글의 탐지에는 뛰어난 성능을 보이는 반면 스테레오타이핑과 분리하기의 댓글을 악플로 판별하는데는 부진함을 발견했다. 또한, ‘클린봇’의 편향된 혐오표현 탐지가 그 대상에 따라서 다른 양상을 보이고 있음도 발견했다. 단순욕설과조롱하기의 모욕형 혐오표현의 경우 성소수자에게 향한 댓글에서 여성과 외국인에 대한 댓글에 비해 악플로의 판별이 더욱 적극적으로 일어난 것이다. 반면스테레오타이핑과 분리하기로 특징되는 낙인형 혐오표현은 여성과 외국인에대한 댓글에서 성소수자에 대한 댓글에 비해 악플로의 판별이 빈번하게 일어났다. 끝으로 악플로 탐지된 혐오댓글의 유형 분석과 대상에 따른 판별 양상의 차이에서 도출한 결과를 바탕으로 건전한 댓글 문화 형성과 여론 왜곡의 방지를 위해 개발 중인 인공지능의 한계를 논의하고 이를 극복하기 위한 방안을 제시했다.