초록 데이터에 대한 기존의 윤리적 검증의 방법은 비도덕적인 금지어를 필터링하는 방식으로 이루어졌는데, 이는 복잡하고 다양한 언어의 사용에 효율적으로 적용하기 어렵고 미묘한 비도덕성을 정확하게 판별하기 어렵다는 난점을 지니고 있다. 본 연구는 인공지능 기술을 활용하여 데이터를 분류하고 조직하는 과정에서 편향된 내용을 포함한 비도덕적인 내용들을 선별하게 하는 기준이 되는 도덕 온톨로지(ontology)로서 ‘비도덕 문장 판별 온톨로지’를 제시하고자 한다. 비도덕 문장 판별 온톨로지는 다양한 도덕 판단의 기준을 도입하여 판단 유형에 따른 보다 체계적이고 정확한 분류 작업을 가능하도록 기획되었으며, 형식(Mode), 유형(Type), 대상(Object), 도덕 정서 술어(P, Predicate) 등의 범주로 이루어져 있다. 이러한 온톨로지는 후속 연구를 통해 보다 정교한 형태로 발전시킬 것이며, 보다 내실 있는 윤리 검증의 틀을 제시함으로써 온라인 공간에서 발생할 수 있는 편향되고 비윤리적인 대화 내용의 비도덕성의 정도를 측정할 수 있는 효율적인 윤리 검증 기준을 제공하고자 한다. 이를 통해 다양한 부문에서 활용할 수 있는 한국형 윤리 검증 표준이라는 생태계 구축에 기여할 것으로 생각된다.
키워드: 윤리적 인공지능, 윤리 검증, 도덕 온톨로지, 금지어, 비도덕성 |