색상 코드·캐릭터 눈 모양까지…알리바바, AI 이미지 정밀도 한 단계 올렸다

[지디넷코리아]

알리바바 그룹이 브랜드 색상 코드부터 캐릭터 세부 특징까지 정밀 제어할 수 있는 인공지능(AI) 이미지 모델로 크리에이터 시장을 공략한다.

알리바바 그룹은 이미지 생성 및 편집 기능을 고도화한 통합 AI 모델 ‘완(Wan)2.7 이미지’를 2일 출시했다고 밝혔다. 모델은 기존 AI 이미지 생성 모델의 획일적 스타일과 예측하기 어려운 색상 결과물 문제를 개선한 것이 특징이다. 크리에이터들이 시행착오를 줄이면서 전문적인 맞춤형 결과물을 구현할 수 있도록 설계됐다.

핵심 개선 사항은 개인화와 색상 제어다. 골격 구조나 눈 모양 등 세부 특징을 정밀하게 조정해 프로젝트별로 차별화된 캐릭터를 만들 수 있다. 새로운 ‘컬러 팔레트’ 기능을 통해 프롬프트에 특정 색상 코드와 비율을 입력하는 것만으로 복잡한 예술적 스타일이나 브랜드 고유 색상을 정확하게 반영할 수 있다.

완2.7 이미지 모델 예시 (사진=알리바바클라우드)

텍스트 렌더링 성능도 강화됐다. 긴 맥락 학습 구조를 기반으로 최대 3000토큰의 텍스트 입력을 지원하며 12개 언어로 인쇄 품질의 학술 텍스트와 복잡한 수식·표 생성이 가능하다. 최대 9개의 레퍼런스 이미지를 활용하고 한 번에 최대 12개의 이미지를 생성해 스토리보드, 건축 렌더링, 이커머스 캠페인 제작에도 쓸 수 있다. 직관적인 ‘클릭 편집’ 인터페이스로 특정 영역을 선택해 픽셀 단위로 요소를 추가·이동·정렬하는 것도 가능하다.

익명으로 진행된 사용자 선호도 테스트에 따르면 시각적 완성도, 텍스트 렌더링, 복잡한 시각 개념 이해도 부문에서 업계 주요 모델들을 앞서는 성능을 보였다고 회사 측은 밝혔다.

함께 공개된 ‘완2.7 이미지 프로’는 안정적인 이미지 구성과 프롬프트에 대한 정밀한 이해, 고해상도 4K 출력을 지원한다. 두 모델 모두 알리바바클라우드의 AI 개발 플랫폼 모델 스튜디오와 완 공식 웹사이트를 통해 이용·배포할 수 있다. 알리바바의 AI 애플리케이션 큐원 앱에도 통합될 예정이다.

알리바바클라우드는 “완 시리즈는 2023년 첫 공개 이후 지속적인 고도화를 거듭했다”며 “AI 기반 멀티미디어 기술 분야에서 우리 기술 경쟁력과 개발 역량을 잘 보여준다”고 강조했다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다