GIST ‘발가락’팀, 국제AI 게임 대회서 우승…6천달러 받아

[지디넷코리아]

GIST AI융합학과 대학원생으로 구성된 ‘발가락’팀(지도교수 김경중)이 국제 AI 게임 플레이 대회 ‘오락 게임 에이전트 챌린지 ‘소규모 언어 모델’ 트랙에서 우승했다.

이 대회는 크래프톤이 주관했다. 엔비디아, 아마존 웹 서비스, 오픈에이아이가 공식 후원사로 참여했다. 총 117개 팀이 참여했고, 총상금은 2만 달러 규모다.

오락 게임 에이전트 챌린지에서 우승한 GIST 발가락팀 4명이 원내 조형물에서 기념촬영했다. 왼쪽부터 AI융합학과 김경보·김유진 석사과정생, 박유천 석박통합과정생, 황금환 석사과정생.(사진=GIST)

주관사인 크래프톤은 ▲ 배틀그라운드 ▲ 테라(TERA) ▲ 인조이(inZOI) 등을 개발한 글로벌 게임 기업이다.

이번 대회에서 GIST는 트랙 우승으로 상금 6,000 달러를 받았다.

‘오락 게임 에이전트 챌린지’는 다양한 비디오 게임 환경에서 AI가 직접 플레이를 수행하며, 연속적인 과제를 해결하는 능력을 겨루는 국제대회다. AI 판단력, 전략 수립 능력, 그리고 환경 적응력을 종합적으로 평가한다.

‘소규모 언어 모델’ 트랙은 제한된 연산 자원과 AI 모델 규모(학습된 정보량과 계산 능력)라는 제약 속에서 에이전트(인공지능 프로그램)를 설계해야 한다. 참가 팀들은 이러한 조건에서 전략을 학습·최적화하며 성능을 겨뤘다.

각 팀은 하나의 언어 모델로 ▲ 슈퍼 마리오 ▲ 포켓몬스터 레드 ▲ 스타크래프트 II ▲ 2048 등 서로 다른 유형의 네 가지 게임을 연속으로 플레이해야 했다. 이 과정에서는 공간 추론, 전략적 의사결정, 자원 관리, 수리적 추론 등 복합적인 능력이 요구된다.

‘발가락’ 팀은 AI 판단 안정성을 높이기 위해 ‘행동 후보 생성’ 기반의 새로운 시스템 구조를 설계했다.

기존 언어 모델 기반 AI는 게임 상황을 해석한 뒤 즉시 행동을 결정하는 방식이어서, 비현실적이거나 일관성 없는 선택을 하는 한계가 있었다.

이를 개선하기 위해 ‘발가락’ 팀은 먼저 실행 가능한 행동을 정리하는 ‘구조적 분석 모듈’을 도입했다. 이 모듈은 게임 상태를 분석해 탐색 방향, 자원 상황, 실행 가능성 등을 고려한 행동 후보와 우선순위를 생성한다. 이후 AI는 이 후보들 중에서 최적의 행동을 선택한다.

언어 모델 기반 시스템 게임 플레이 장면. (왼쪽부터 슈퍼 마리오, 포켓몬스터 레드, 스타크래프트 II, 2048)(그림=GIST)

또한 AI가 선택한 행동이 실제로 실행 가능한지 확인하고, 정해진 형식 안에서만 행동을 생성하도록 제한하며, 잘못된 결과가 나오면 추가 지시를 통해 수정하는 등 다양한 안정화 장치를 적용해 서로 다른 게임 환경에서도 시스템이 안정적으로 작동하도록 했다.

김경중 교수는 “이번 성과는 여러 게임 환경에서 소규모 언어 모델(SLM)의 범용적 활용 가능성을 보여주었다는 점에서 기술적 가치가 크다”며, “불확실성이 높은 환경을 창의적인 알고리즘으로 극복해 낸 것”이라고 말했다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다