[지디넷코리아]
프렌들리AI가 삼성SDS와 손잡고 기업들의 추론 인프라 구축 부담을 낮춘 프론티어 인공지능(AI) 모델 서빙 서비스를 본격 가동한다.
프렌들리AI는 삼성SDS와 협력해 삼성 클라우드 플랫폼(SCP)의 엔비디아 B300 그래픽처리장치(GPU) 기반 프론티어 AI 모델 추론 인프라를 운영한다고 2일 밝혔다. 이번 협력은 단순한 인프라 연동을 넘어 프렌들리AI의 고성능 추론 최적화 서비스와 SCP의 확장형 B300 GPU 서비스형인프라(IaaS)를 결합한 구조다.
최근 GLM-5, 딥시크 v3.2 등 초대형 프론티어 모델이 잇따라 등장하면서 기업들의 추론 인프라 수요도 급격히 커지고 있다. 양사는 글로벌 스타트업과 엔터프라이즈 기업을 주요 타깃으로, 복잡한 커스텀 스택 구축 없이 최신 모델을 즉시 프로덕션에 투입할 수 있는 환경을 제공한다는 목표다.

주요 특징은 네 가지다. 우선 GLM-5, 미니맥스 M2.5, 딥시크 v3.2 등 차세대 모델을 출시와 동시에 지원하는 ‘데이-0’ 체계를 갖춰 별도의 커스텀 추론 스택 없이 즉시 도입이 가능하다. 프렌들리AI의 자체 추론 엔진과 SCP의 B300 GPU를 결합한 초고속·저지연 환경도 운영될 예정이다.
또 토큰 기반 과금 구조로 사용량에 따른 유연한 비용 모델을 제공하며 고속 추론과 대규모 확장성을 동시에 지원한다. SCP의 고가용성 B300 IaaS와 프렌들리AI 추론 플랫폼을 통합 운영해 글로벌 저지연 서비스와 엔터프라이즈급 안정성도 확보한다.
전병곤 프렌들리AI 대표는 “삼성 SCP와 협력해 전 세계 기업들에게 고성능·고효율 AI 추론을 제공하게 돼 기쁘다”며 “고객들은 최신 프론티어 모델을 안정적으로 활용하고 에이전틱 AI 기반의 새로운 비즈니스 기회를 모색할 수 있을 것”이라고 피력했다.
