화면 왜곡 없이 상상하는 AI…트릴리온랩스, 세계 첫 모바일 월드모델 공개

[지디넷코리아]

트릴리온랩스가 모바일 환경에서 사용자 조작에 따른 미래 변화를 코드로 시뮬레이션하는 기술을 선보이며 실행형 인공지능(AI) 시장 선점에 나선다. 단순 이미지 생성을 넘어 웹 코드를 통해 화면을 재현함으로써 기존 월드모델의 고질적인 문제인 화면 왜곡을 해결했다.

트릴리온랩스는 주변 환경의 인과관계를 학습해 화면 변화를 실시간으로 재현하는 모바일 월드모델 ‘g월드-32B’를 세계 최초로 개발했다고 9일 밝혔다. g월드-32B는 AI 에이전트가 특정 행동을 하기 전 그 결과를 시각적·논리적으로 상상해 시뮬레이션하는 기술이다.

기존 월드모델은 다음 화면을 이미지(픽셀) 단위로 생성해 글자가 뭉개지거나 형태가 왜곡되는 한계가 있었다. g월드-32B는 실행 가능한 웹 코드(HTML·CSS) 형태로 결과물을 예측해 구조적 한계를 개선한 것이 특징이다.

(사진=트릴리온랩스)

이 기술은 다음 화면의 사진을 찍어 보내는 방식이 아닌, 정교한 설계도에 해당하는 코드를 생성해 실시간 고화질 렌더링을 유도한다. 렌더링 실패율을 1% 미만으로 낮췄으며 텍스트와 아이콘을 왜곡 없이 선명하게 유지하는 높은 정확도를 확보했다.

특히 모델 최적화 기술로 매개변수 규모가 50배 이상 큰 초거대 AI 모델 ‘라마(Llama)-4-402B’를 상회하는 그래픽 사용자 인터페이스(GUI) 예측 성능을 기록했다.

국내 모바일 환경에 특화된 한국어 벤치마크인 KApps(한국 모바일 앱 조작 성능 평가 지표)에서도 별도 추가 학습 없이 바로 실전에 투입 가능한 ‘제로샷(Zero-shot)’ 성능을 구현했다.

트릴리온랩스는 이 모델을 실행형 AI 기술로 발전시켜 디지털 서비스 운영 전반의 자동화를 지원할 계획이다.

신재민 트릴리온랩스 대표는 “묻고 답하는 AI를 넘어 복잡한 디지털·물리적 환경에서 직접 행동하는 실행형 AI 시대가 도래했다”며 “이는 정부 AI 전략 과제가 본격화되기 이전부터 월드모델에 집중해 온 결과물”이라고 말했다.

신 대표는 “로보틱스와 공공 서비스 자동화 등 다양한 영역에서 대한민국 AI 주권과 산업 경쟁력에 혁신을 가져올 것으로 기대한다”고 덧붙였다.

Post Views: 2