중앙대학교 인문콘텐츠연구소

HK+인공지능인문학

아카이브칼럼

칼럼

글보기
인공지능 면접의 학습과 편향
Level 10조회수244
2022-06-21 16:47

 

인공지능 면접(이하 AI 면접)은 인적 자원 관리에서 핵심으로 손꼽히는 혁신 기술이다. 인공지능 면접의 대상과 비중이 확장되는 현시점에서 AI 면접의 머신 러닝 학습 원리를 파악하고, 그로 인해 야기될 수 있는 편향을 주의 깊게 살펴볼 필요가 있겠다. 근래 AI는 머신 러닝(machine learning)과 인공신경망을 기반으로 한 심층학습(deep learning)을 바탕으로 비약적인 발전을 선보이고 있다(안수현, 2017). 기업 채용 과정에 AI가 도입된 역사는 그리 길지 않으나, 2018년 조사 결과 이미 포춘지가 선정한 미국의 500개 기업 대부분은 AI를 채용 과정에 도입했으며, 국내에서도 상당히 많은 기업들이 면접 또는 자기소개서 평가에서 AI 기술을 활용하고 있다. AI 면접 프로그램들은 보통 영리적인 목적으로 개발되어, 프로그램 개발 업체에서 사용 업체에 납품을 하게되므로 작동 원리가 상세하게 공개되어 있지 않으나, 빅데이터와 뇌신경과학을 기반으로 둔다는 점을 공통적으로 내세우고 있다. 예컨대 인에어(inAir) 개발 업체 마이다스아이티(Midas IT)에서는 역량 분석 게임 수행 결과를 분석하기 위해 6,800여 명의 재직자 성과 데이터와 응시데이터를 학습한다고 밝혔고, 1억 건 이상의 평가 데이터를 학습한 AI가 지원자의 실시간 반응을 통해 평가하는 소통 능력과 호감도를 평가한다고 홍보하였다. 또한, 사람 면접관에게 지원자들의 영상을 보며 평가하도록 하여, 그 자료를 바탕으로 주요 특징을 추출하고 머신 러닝 알고리즘을 통해 면접관의 판단 메커니즘을 학습한다 (midashri.com). 이처럼 AI 면접 프로그램이 빅데이터를 활용하고, 머신 러닝 기술을 통해 진화하고 있음이 알려짐에 따라 한 명 또는 소수의 사람 면접관이 지원자의 당락을 결정하는 것보다 AI 면접 프로그램이 더 객관적이고 신뢰할 만한 판단을 할 것이라는 대중 및 인사담당자들의 기대가 높아지고 있다.

그러나 머신 러닝은 근본적으로 수많은 데이터를 살펴보며 데이터 안에서 패턴과 유사성을 찾아낸다. 앞서 나온 예시로 돌아가자면, 머신 러닝을 통해 AI는 고성과자로 구분된 재직자들의 데이터를 살펴보며 그 데이터에서 공통으로 추출된 핵심요인들을 바탕으로 성과예측모형 등을 만들어낸다. AI 면접 프로그램은 이러한 모형을 토대로 실제 지원자의 반응을 고성과자 반응 패턴과 비교함으로써 지원자를 평가할 수 있게 된다. 현재 AI 면접 결과가 보조자료 수준으로 활용되고 있으나, AI 면접 프로그램의 진화와 진화 과정에서 발생할 수 있는 편향에 대해서는 고민해볼 필요가 있다. 이 때 우리는 ‘고성과 재직자,’ ‘고득점으로 입사한 신입사원,’ ‘우수 면접관’ 등으로 추출된 사람들이 어떤 근거로 선출되었는가를 살펴봐야 한다. 선출 근거 중 일부는 객관적인 자료를 기반으로 할 것이다. 예컨대 고성과자 대 저성과자 구분의 경우, 판매량과 같은 실적이 준거가 될 수 있겠다. 그러나 대다수의 기업에서는 실적만으로 고성과자와 저성과자를 구분하지 않으며, 다양한 평가도구를 활용하여 종합적인 평가를 시도하는데, 예를 들자면 상사, 동료, 부하로부터 의견을 수합하는 360도 피드백이 대표적이다. 따라서 패턴을 발견하고 모형을 구축하는 것은 AI일지라도 평가 또는 학습 자료 구축에는 사람의 평가가 크게 관여하게 되는 것이다. 우수면접관도 마찬가지이다. 통상적으로 우수면접관이란 면접관 경험이 풍부하며, 면접 평가 결과가 직원의 성과 또는 적응을 잘 예측해 온 증거를 갖춰야 한다. 그러나 국내 기업의 경우, 여전히 경력이 높아질수록 남성 비율이 높아지며, 그에 따라 남성 면접관이 여성 면접관보다 훨씬 더 많다. 뿐만 아니라 고용노동부의 2017년 조사에 따르면, 서류전형 합격자 성비는 여성이 남성의 101%를 차지하였으나, 면접 뒤에는 여성 합격자 비율이 남성의 69%로 낮아졌고, 민간기업 473개사를 대상으로 한 ‘채용시 선호 성별’ 조사 결과에 따르면 32.8%의 기업이 상대적으로 선호하는 성별이 있다고 밝힌 바 있다. 편의를 위해 성별 이슈가 부각되는 예시를 들었으나, 이 밖에도 ‘우수’하다는 평가 속에 얼마나 다양한 오염요인이 존재할 수 있는지, 그리고 ‘편향 없이 공정한’ 평가 데이터를 구축하기 위해서는 얼마나 까다로운 기준을 충족해야 하는지 짐작할 수 있다. 

양적으로 풍부하다 할지라도 평가 데이터가 편향되어 있다면, AI 면접은 점점 더 공정해지는 것이 아니라 인간의 편향과 점점 더 가까워질 뿐이다. 더 나아가 차별을 고착화하고 편향을 강화하게 될 수도 있다. O’Neil(2016)에 따르면 예측모형은 단순히 데이터로부터 만들어지는 것이 아니라, 어느 데이터가 관심을 기울이고 어느 것을 제외할지에 대한 사람의 선택에 의해 만들어진다. 결국 AI 면접은 복잡한 채용 과정 중 일부이며, 최신의 기계가 도입된 혁신적 단계이지만 그와 동시에 사람의 문해력과 통찰을 요구하는 도구이다. 그러므로 (주로 기업 외부에서 만들어진) AI 면접 프로그램이 얼마나 발전할 수 있고, 또 얼마나 객관적인 형태로 진화할 수 있을지는 머신러닝 또는 딥러닝 기술 발전에 달린 문제가 아니다. 많은 미래 학자들의 주장과 같이 신기술들이 맡은 일을 더 잘 수행할 수 있도록 돕는 인간의 몫인 것이다. 따라서 면접 프로그램을 사용하는 기업의 인사 담당자들은 위와 같은 잠재적인 문제들에 대해 개발자와 함께 고민하며 통찰을 이끌어내야 한다. 또한, 개발자에게 어떤 데이터를 제공하는 것이 더 큰 이익(향후 더 나은 서비스)으로 돌아올 것인지 고민하여 AI 면접의 발전에 직접적으로 관여해야만 미래의 AI 면접은 지금보다 더 공정해질 것이고, 그로 인해 채용 과정의 고질적인 문제들을 돌파하는 하나의 솔루션으로 자리매김할 수 있을 것이다. 

--------------------------
참고자료: 안수현 (2017). 지능형 인공지능 (AI)의 발전에 따른 자본시장법제 정비방향과 과제, 증권법연구, 18(3), 137-176. O'neil, C. (2016). Weapons of math destruction: How big data increases inequality and threatens democracy. Broadway Books.

문혜진(중앙대학교 인문콘텐츠연구소 HK연구교수)

중앙대학교 인문콘텐츠연구소
06974 서울특별시 동작구 흑석로 84 중앙대학교 310관 828호  TEL 02-881-7354  FAX 02-813-7353  E-mail : aihumanities@cau.ac.krCOPYRIGHT(C) 2017-2023 CAU HUMANITIES RESEARCH INSTITUTE ALL RIGHTS RESERVED