[지디넷코리아]
엔비디아가 아마존웹서비스(AWS)와 협력을 확대하며 클라우드 기반 AI 인프라 주도권 굳히기에 나섰다. 그래픽처리장치(GPU) 중심의 기존 우위를 바탕으로 데이터 처리와 AI 모델까지 영역을 넓히며 경쟁사들과의 격차 확대에 나선 모양새다.
엔비디아는 미국 새너제이에서 열린 ‘GTC 2026’에서 AWS와의 협력을 통해 GPU 가속 솔루션을 확대한다고 18일 밝혔다. 양사는 AWS 환경에서 엔비디아 기반 데이터 처리 기능을 확장하고 네모트론(Nemotron) 오픈 모델 제품군 지원을 추가할 계획이다.
이번 협력은 단순 인프라 제공을 넘어 풀스택 AI 생태계 구축으로 이어진다는 점에서 주목된다. 엔비디아와 AWS는 2010년부터 협업을 이어오며 GPU 인프라, 소프트웨어, 서비스 전반을 통합한 솔루션을 제공해왔고 이를 통해 기업의 AI 구축 및 배포 시간을 단축해왔다.

특히 이번 발표에서 주목되는 부분은 최신 GPU의 클라우드 도입이다. 엔비디아의 ‘RTX 프로 4500 블랙웰 서버 에디션’ GPU는 아마존 EC2 인스턴스를 통해 AWS에 처음 도입될 예정이다. AWS는 해당 GPU를 지원하는 최초의 클라우드 사업자로, 이를 통해 고객은 온프레미스 수준의 블랙웰 성능을 클라우드에서도 활용할 수 있게 된다.
해당 인스턴스는 AWS 니트로 시스템 기반으로 설계돼 보안성과 안정성을 강화했으며 아마존 EMR과 결합 시 대규모 데이터 처리 워크로드에 최적화된 성능을 제공한다. 이는 데이터 분석 및 AI 학습 환경에서 클라우드 활용도를 한층 끌어올릴 것으로 전망된다.
AI 모델 측면에서도 협력 범위가 확대됐다. 엔비디아의 ‘네모트론 나노 3’ 모델은 세일즈포스의 AI 플랫폼 ‘에이전트포스’에 아마존 베드록을 통해 제공된다. 해당 모델은 높은 처리량이 요구되는 B2C 애플리케이션 환경에서도 활용 가능하며 세일즈포스 벤치마크 기준 요약 및 생성 작업에서 높은 비용 효율성을 보인 것으로 평가된다.
또 AWS는 아마존 베드록에서 네모트론 모델을 위한 강화 학습 기반 파인튜닝(RFT) 기능을 지원할 예정이다. 이를 통해 개발자는 특정 산업에 맞춰 모델의 추론 방식과 응답 구조를 정밀하게 조정할 수 있다. 이는 법률, 헬스케어, 금융 등 고도화된 전문 영역에서 AI 활용도를 높이는 핵심 기능으로 꼽힌다.
AWS 역시 이번 협력을 통해 AI 인프라 경쟁력 강화에 나선 것으로 해석된다. 기업들이 엔비디아 ‘쿠다(CUDA)’ 생태계를 중심으로 AI를 개발하는 상황에서 최신 GPU를 선제 확보해 고객 이탈을 막고, 아마존 EMR과 베드록 등 자사 서비스와 결합해 AI 워크로드를 플랫폼 내부에 묶어두려는 전략이다. 업계에선 AWS가 자체 AI 칩과 엔비디아 GPU를 병행하는 ‘투트랙 전략’을 통해 성능과 비용 경쟁력을 동시에 확보하려는 행보로 보고 있다.
업계 관계자는 “AWS는 단순히 GPU를 도입하는 수준을 넘어 AI 인프라 전반을 자사 플랫폼 중심으로 재편하려는 듯 하다”며 “이번 일을 기점으로 향후 생성형 AI 서비스 경쟁에서 클라우드 사업자의 영향력이 더 커질 가능성이 있다”고 말했다.
