인공지능을 현재의 형태로 만들기 까지 인간은 끊임없이 ‘인간’을 탐구해왔다. 인간처럼 생각하고 행동하는 인공지능 개발에 대한 꿈이 역사 속에서 많은 부침을 겪을 때 몇몇 연구자들은 ‘인간의 작동 원리’에 관한 연구들을 파헤치며 기술을 다듬어 나갔다. 인간처럼 생각하는 기계를 만드는 데 가장 큰 기여를 한 분야는 당연히 인간의 뇌에 대한 연구였지만, 의외로 오랫동안 큰 관심을 받는 분야는 인간의 ‘얼굴’에 대한 연구들이다. 18-19세기 서구 사회의 과학자들은 인간의 얼굴이 생각보다 많은 정보를 제공한다고 믿었다. 이 때 이른 바 유사과학 (Pseudo-science)이 여러 형태로 성행했는데, 공통적인 주장은 인간의 얼굴에서 사람의 성격이나 기질을 판단할 수 있다는 것이었다. 감정학(Pathognomy)은 제스처, 목소리, 표정 같은 신체 표현을 통해 감정을 탐구하였고, 골상학(Physiognomy)은 얼굴 형태를 통해 개인의 기질이나 성격을 알 수 있다고 주장했다. 두개학(Phrenology)은 두개골의 형태에서 사람의 심적 특성뿐 아니라 운명까지 예측하기도 했다. 대부분은 차별과 배제를 양산하는 유사과학으로 비판받으며 후에 사라졌지만, 성행하던 당시에는 프랑스 등 서구사회에서 매우 대중적인 “과학”의 형태로 인간의 얼굴을 이해하기 위한 실험들이 이어졌다. 이 유사과학은 겉으로 보이는 외형에 대한 평가를 통해 범죄, 정신질환, 사기 등의 징후로서 얼굴을 분석하면서 계층을 구분 짓고 끊임없이 차별을 양산하였다. 골상학, 두개학이 유사과학으로 비판 받고 사라진 후에도 얼굴에 대한 관심은 여전했는데 대표적인 학자가 미국의 심리학자 폴 에크만 (Paul Ekman)이었다. 보다 정확하게 에크만은 인간의 ‘얼굴 표정’에 관심이 있었다. 에크만은 인종, 성별, 국적, 언어 등의 문화적 특성과 무관하게 모든 인간에게는 보편적인 감정 표현이 존재한다고 믿었다. 몇몇 다른 인종의 실험 참여자를 만나고 파푸아 뉴기니에서 비슷한 실험을 거듭하며 나름대로 이론적 증거를 정립하면서 인간에게는 보편적인 감정 (분노, 공포, 혐오, 슬픔, 즐거움, 놀람, 경멸)이 있고 이 감정들은 동일한 얼굴 표정으로 나타나 맥락 없이도 모든 감정을 파악할 수 있다고 주장했다 (Ekman & Friesen, 2003). 당연히 에크만의 이론은 비판받았다. 많은 학자들이 에크만의 실험은 서구 중심의 감정체계와 이해를 다른 문화권에서 시험해 본 것에 그치는 매우 위험한 서구 중심적 사고이며, 문화에 대한 이해가 부재한 채 진행된 권위적인 실험이라 비판했다. 수많은 비판에도 불구하고 에크만의 이론은 골상학이나 두개학처럼 사라지지 않았다. 특히 에크만이 정의한 감정에 따른 얼굴 표정과 그가 나름 체계적으로 이론화한 눈과 입 근육의 움직임 FACS (Facial Action Units)는 18-19세기 골상학이나 두개학만큼이나 인기를 얻으며 사회적으로 통용되었다. 큰 인기를 얻었던 애니메이션 인사이드 아웃 (Inside Out, 2015) 역시 에크만이 정의한 7가지 보편적인 감정이 캐릭터로 등장하며, 거짓말 탐지기도 에크만의 이론을 기반으로 얼굴 근육의 움직임을 추적하여 추론한다. 무엇보다 인공지능을 개발하는 세계적 기업에게 환대를 받으며 사회적 사실로 재생산되어 왔다. 인간의 감정을 읽어보기로 결심한 인공지능은 얼굴 표정을 분석한다. 보다 정확하게 표현하면 얼굴 근육이 움직이며 만들어내는 모양, 크기, 각도의 변화를 계산한다. 에크만의 연구는 인공지능의 계산 결과를 특정 감정으로 추론하는 데 이론적 근거를 제공해왔다.
(좌) 에크만의 FACS 중 일부 (Tian et al., 2001) (우) 감정분석 인공지능 (“Face Detection Conceptions Overview”, 2019) 에크만의 보편적 얼굴 표정에 대한 비판은 지금도 진행형이다. 케이트 크로퍼드 (Kate Crawford)는 그의 저서 <Atlas of AI: Power, Politics, and the Planetary Costs of Artificial Intelligence> (2021)에서 안면인식을 통해 감정을 분석하는 대부분의 세계적 기업이 그렇게 믿고 싶지 않겠지만 표정이 보편적인 감정을 드러낸다는 증거는 없다고 지적했다. 영국 케임브리지 대학 연구진 역시 이모지파이 프로젝트 (Emojify Project)를 통해 감정인식 기술이 가진 기본적인 결함을 지적했다. 연구진이 개발한 두 가지 게임(fake smile game, wink/blink game)으로 몇 가지 얼굴 표정을 시험했는데 입은 웃고 눈은 웃지 않는 이른 바 “썩소”를 지어도 기계는 ‘행복’의 감정을 결과 값으로 추론해냈다. 감정이 정말 인류 보편적인 것인지, 표정만으로 감정을 읽을 수 있는 것인지, 초기 연구 설계에서 해결하지 못한 문화적 차별과 배제는 어떻게 개선할 것인지 합의하지 못한 채 인공지능은 에크만의 이론을 학습했다. 그리고 소비자나 사용자의 기분을 파악하기 위해 얼굴을 관찰하고 움직임을 측정한다. 인공지능이 기본적으로 ‘계산하는 기계’임을 생각하면 에크만의 이론은 인간의 감정을 판단하는 데 그럴싸한 수학적 근거를 제공하는 완벽한 이론임에 틀림없다. 인공지능의 감정분석은 사진첩을 만들어주고 광고를 제시하는 모바일기기나 사회 관계망 서비스뿐 아니라 자율주행 자동차, 가전제품에까지 활용되어 사용자의 성별, 나이, 감정 상태나 만족도 등을 파악할 예정이다. 인간의 감정이 정말로 보편적인지 아직 풀리지 않은 역사적 숙제가 남은 채 제대로 검증되지 않은 가설이 사회와 문화의 곳곳에서 끊임없이 재생산되고 있다. 개인맞춤형 서비스를 제공해 사용자를 종종 놀라게 했던 인공지능의 감정분석기능은 얼굴을 분석해 온 유사과학의 꽤 오랜 역사 속에서 만들어졌다. 오랫동안 이어져 온 비판에도 불구하고 인공지능 산업의 목표를 이루기 위해 너무 쉽게 믿어버린 이론, 과학, 혹은 그저 주장에 우리는 어떤 제동을 걸 수 있을까? 이정현 (중앙대학교 인문콘텐츠연구소 HK연구교수) 참고문헌 ------------------------- Ekman, P., & Friesen, W. V. (2003). Unmasking the Face: A Guide to Recognizing Emotions from Facial Clues. ISHK. Face Detection Concepts Overview | Mobile Vision. (2016). Google Developers. https://developers.google.com/vision/face-detection-concepts Tian, Y.-I., Kanade, T., & Cohn, J. F. (2001). Recognizing action units for facial expression analysis. IEEE Transactions on pattern analysis and machine intelligence, 23(2), 97–115. |