중앙대학교 인문콘텐츠연구소

HK+인공지능인문학

아카이브칼럼

칼럼

글보기
인공지능 기술의 가까운 미래
Level 10조회수45
2024-02-27 10:50

디지털 컴퓨터나 인공지능 기술의 역사를 돌아보면 컴퓨팅 성능의 증가는 인공지능 기술의 발전에 결정적인 역할을 해 왔다. 그렇다면 향후에도 컴퓨팅 성능의 증가로 인해 인공지능 기술이 비약적으로 향상하리라 짐작할 수 있다. 인공지능의 역사에서 인공지능 기술은 몇 번의 부침을 겪으며 발전해 왔는데 그 중 1980년대 후반에서 2000년대 초반까지 인공지능의 두 번째 암흑기를 맞이한 이유는 복잡한 연산을 처리할 만한 능력, 즉 컴퓨팅 자원의 부족이었다. 현 시대는 CPU, GPU, 메모리, 저장장치 등 하드웨어가 발달하여 컴퓨팅 처리 능력이 향상되었고, 이를 기반으로 전에는 불가능하던 기술이 구현 가능해지면서 인공지능의 부흥기로 불리고 있다. 지금 이 순간에도 컴퓨터 하드웨어 기술은 지속적으로 발전하고 있다. 하지만, 최신의 인공지능 모델들은 정확도를 향상시키거나 더욱 복잡하고 새로운 작업을 처리하기 위해 천문학적인 수준의 계산량을 요구하며, 이 때문에 거대한 자본력을 갖는 대기업만이 전유할 수 있는 기술로 자리잡고 있는 것이 현실이다. 기술 개발을 위한 자본이 소수 권력 집단에 집중되는 구조가 지속되는 탓에 현재 인공지능 기술의 발전속도는 공학 이론의 발전 속도에 비해 점진적으로 진행되는 상황이다. 

이런 흐름을 극적으로 바꿀 수 있는 새로운 기술이 가까운 미래에 등장할 것으로 예상된다. 이는 ‘양자컴퓨팅’ 기술이다. 현재의 반도체 기술은 하나의 비트에 0 또는 1 중 한 개의 값만 저장할 수 있다. 반면, 양자 컴퓨팅 기술은 양자역학 기반의 큐비트를 이용하여 0 과 1을 동시에 중첩하여 저장할 수 있고, 동시에 다룰 수 있는 값이 늘어나기에 처리 성능이 비약적으로 발전한다. 구글은 기존 슈퍼컴퓨터로 1만년이 걸리는 연산이 양자 큐비트를 이용하면 200초 만에 가능하다고 발표한 바 있다. 이런 성능이 가능하다면 먼저 딥러닝 학습에 매우 긍정적인 변화가 생긴다. 딥러닝 모델이 더 깊고 넓은 형태로 인공신경망을 쌓고, 이를 충분히 학습할 능력이 생긴다면 현재 우리가 생각하는 것 이상의 월등한 능력을 가질 것이다. 또한 기존에는 성능 문제로 생각하지 못했던 새로운 딥러닝 아키텍처를 고안하는 것도 가능할 것이다. 자연어처리 기술을 극적으로 끌어올린 트랜스포머를 생각해보면, 이 딥러닝 아키텍처는 학습용 파라미터가 천억 단위이며 컴퓨팅 처리능력이 없었다면 이런 구조를 처리할 수 없었을 것이기에, 앞으로도 새로운 형태의 딥러닝 아키텍처의 등장을 기대할 수 있을 것이다. 이 밖에도 인간 개발자가 관여해야 하는 데이터 전처리, 모델 설계, 하이퍼 파라미터 튜닝 등을 인공지능 스스로가 하도록 자동화하는 것도 가능할 것이다. 현재의 기계학습은 사람이 모델을 설계하여 학습데이터세트를 다르게 입력해보며 무엇이 가장 적합한 데이터일지 결정하는 과정을 거친다. 컴퓨팅 기술의 발전은 이 과정에서 인간 개발자의 개입을 점차 최소화할 수 있는데 기계가 스스로 데이터를 모으고 최적의 모델을 결정하는 과정을 수행할 수 있다면 기술적 측면에서 훨씬 고도화되고 안정화된 인공지능 모델을 생성하는 것이 가능하다는 의미이다. 하드웨어의 발달은 인공지능 원천 기술의 발전으로 이어지고, 응용 분야에도 자연스럽게 반영이 될 것이다.

두 번째로 미래의 기계학습은 데이터 학습 능력을 개선하며 현재의 기계학습 모델이 초래하고 있는 사회 문제들을 해결할 가능성이 있다. 인공지능은 데이터의 학습을 근간으로 하기에, 학습용 데이터의 품질과 이를 학습하는 알고리즘에 따라 그 성능이 결정된다. 앞서 한계점으로 지적한 바와 같이 기계학습 연구에서 어려움을 겪는 것 중 하나는 데이터 부족과 불균형성에 있다. 데이터가 충분하지 않다면 만족할 만한 규칙을 찾기 어려우며, 데이터가 불균형 하다면 한쪽의 관점으로 치우친 모델이 되기 마련이다. 이러한 어려움을 개선할 수 있는 방안으로 최근 등장한 생성형 인공지능이 좋은 해법이 될 것으로 보인다. 생성형 인공지능은 새로운 데이터를 만들어 내는 데에 탁월한 능력을 보이므로, 특정 분야의 문장이나 이미지 등 데이터 부족 문제를 극복하기에 좋은 대안이 될 수 있다. 또한, 학습 알고리즘도 개선되어 기존 학습을 기반으로 소량의 추가학습을 수행하는 퓨샷(few-shot) 러닝이나 제로샷(zero-shot) 러닝이 활용되는 추세이다. 향후에는 서로 다른 데이터를 학습한 모델들이 상호 협업하거나, 학습이 완료된 이후에도 추가 데이터에 대한 실시간 업데이트 등 인공지능의 학습 능력은 지속적으로 개선될 것으로 보인다. 

마지막으로 인공지능의 적용에서 항상 조심스럽게 다루어져야 하는 부분은 인간에 대한 존엄성이다. 때문에 정보보안과 윤리성 강화가 기술 개발과 병행되어야 함은 자명한 사실이다. 현재도 개인 또는 기업의 민감한 정보를 보호해야 한다는 인식과 윤리적 편향성 극복을 위한 논의는 계속 등장하고 있지만, 이에 대한 기술적인 고민이나 뒷받침은 부족한 상황이다. 정보보안의 경우 사회 전반을 자동화하는 과정에서 개인이나 기업의 민감정보가 과도하게 수집되고 처리되고 있지만 이를 방지하기 위한 기술적인 고민은 정보 인식 정확도를 높이기 위한 기술 연구에 비해서는 더디게 이루어지고 있다. 윤리적인 측면에서도 마찬가지다. 인공지능 기술이 기계에 의해 자동적으로 이루어지는 것 같지만 사실은 기계가 정상적인 범주에서 작동하기 위해 비윤리적인 데이터나 유해정보를 인간이 직접 걸러내고 있는 역설적인 상황이다. 유튜브에서는 높은 조회수를 목적으로 자극적인 주제의 가짜뉴스가 지속적으로 생성되고 있으며 사용자의 신고가 없는 한 여과없이 계속 게시되기도 한다. 챗지피티(ChatGPT)의 경우 부적절한 답변이 나오지 않도록 하기 위해 개발사의 외주 데이터처리 회사가 케냐 노동자를 저임금으로 고용하여 매일 비윤리 데이터를 필터링하도록 착취를 가했다는 논란이 존재한다. 지금 막 전 세계적으로 실천강령을 발표하기 시작한 인공지능 윤리 및 개발자 행동강령 등의 지침을 토대로 정보보안과 인공지능 윤리에 대한 인식이 인공지능 기술개발이 안정되는 과정에서 필수적으로 결합될 필요가 있다. 특히 비윤리 데이터의 필터링이나 일부 필수 정보의 라벨링 같은 기계학습 전처리 작업이 사람의 수작업 보다는 체계화되고 자동화된 방법으로 수행될 필요가 있으므로 이와 관련한 연구와 직업도 늘어나야 할 것이다.

중앙대학교 인문콘텐츠연구소 HK교수 이기성 


첨부파일240227.jpg (83.4KB)
중앙대학교 인문콘텐츠연구소
06974 서울특별시 동작구 흑석로 84 중앙대학교 310관 828호  TEL 02-881-7354  FAX 02-813-7353  E-mail : aihumanities@cau.ac.krCOPYRIGHT(C) 2017-2023 CAU HUMANITIES RESEARCH INSTITUTE ALL RIGHTS RESERVED