“‘전우’ 하나 빠져도 팀플은 계속”…UNIST, 군집 AI 돌발 생존 기술 개발
인공지능대학원 한승열 교수팀 ‘성과’ AI 간 협력 붕괴 상황 일부러 만들어 훈련 스타크래프트 실험서 승률 87% 기록 드론·군집로봇·스마트팩토리 적용 기대
2026-06-24 정수진 기자
UNIST 인공지능대학원 한승열 교수팀은 AI 에이전트 간의 협력 고리를 일부러 끊어보며 훈련하는 멀티에이전트 강화학습 기술인 ‘상호작용 차단 적대 학습(IBAL, Interaction-Breaking Adversarial Learning)’을 개발했다고 24일 밝혔다.
연구팀의 IBAL은 일부 AI가 멈추거나 서로의 위치와 상태를 제대로 파악하지 못해도, 남은 AI들이 새로운 협력 방식을 찾아 임무를 이어가게 하는 학습법이다. 축구로 치면 한 선수가 빠졌을 때 기존 전술만 고집하는 대신, 남은 선수들이 빈 공간을 메우고 공격과 수비 역할을 다시 나누도록 훈련하는 것과 비슷하다.
이러한 대응 능력을 키우기 위해 학습 과정에서 협력 네트워크가 깨지는 상황을 반복적으로 만들게 된다. AI를 두 그룹으로 나누고, 어떤 정보와 행동이 그룹 간 협력에 중요한지를 상호정보량으로 분석해 찾아낸 뒤 중요한 ‘정보’를 가리고 협력을 깨뜨리는 ‘행동’을 유도하는 것이다.
또 매 학습 단계마다 그룹 구성을 무작위로 바꾸고 공격 강도를 학습 상황에 맞춰 자동으로 조절함으로써, 다양한 형태의 협력 붕괴 상황을 폭넓게 경험하도록 설계됐다.
제1저자인 이선우 연구원은 “기존 다중 에이전트 강화학습에서는 주로 센서 정보에 의도적으로 잡음을 넣거나, AI가 임무 수행에 불리한 행동을 하도록 만들어 훈련한 반면, IBAL은 개별 AI의 판단을 방해하는 데 그치지 않고 AI들의 협력 관계 자체를 흔들게 된다”며 “이를 통해 일부 AI가 고장 나거나 통신이 끊긴 상황에서도 남은 AI들이 새로운 협력 방식을 찾아 임무를 이어가도록 훈련할 수 있다”고 설명했다.
연구팀은 유명 전략 게임 ‘스타크래프트 II’ 기반의 실험 환경(SMAC)에서 아군 유닛 일부가 갑자기 작동을 멈추는 돌발 상황을 가정해 성능을 검증했다. 실험 결과, 기존 AI 모델들은 팀원 결손 시 전체 협력 체계가 도미노처럼 무너지며 일부 모델은 승률이 13.3%까지 급락했다. 반면 IBAL로 학습한 경우에는 체력이 떨어진 유닛을 후방으로 빼고 건강한 유닛을 전면에 내세우는 등 즉각적으로 진형을 재구축해 87.0%라는 압도적인 승률을 기록했다.
한승열 교수는 “자율 드론과 군집 로봇, 스마트 팩토리처럼 여러 AI가 함께 움직이는 시스템은 일부 장비가 고장 나거나 통신이 끊기면 문제가 된다”며 “이번 기술은 이런 돌발 상황에서도 남은 AI들이 스스로 역할을 다시 나누고 임무를 이어가도록 훈련할 수 있어, 앞으로 다수의 AI가 함께 작동하는 시스템의 안전성과 신뢰성을 높이는 기반 기술이 될 것”이라고 기대했다.
연구 결과는 세계 3대 인공지능 학회 중 하나인 국제머신러닝학회(International Conference on Machine Learning, ICML) 2026에 채택됐다. 2026 ICML은 오는 7월 6일부터 11일까지 서울 코엑스에서 열린다.