엔비디아가 생성형·에이전틱 AI 시대에 대응하기 위한 추론 인프라 소프트웨어를 공개했다.
엔비디아는 미국 새너제이에서 열린 'GTC 2026'에서 오픈소스 기반 AI 추론 소프트웨어 '다이나모(Dynamo) 1.0'을 발표했다고 17일 밝혔다.
다이나모는 대규모 AI 추론을 효율적으로 처리하기 위한 소프트웨어로, 클러스터 내 GPU와 메모리 자원을 통합 관리하는 역할을 한다. 엔비디아는 이를 AI 팩토리의 '운영체제(OS)'에 비유했다.
최근 생성형 AI를 넘어 에이전틱 AI가 실제 서비스 단계로 확산되면서 데이터센터 내 추론 작업을 효율적으로 분산·관리하는 문제가 핵심 과제로 떠오르고 있다. 다양한 규모의 요청과 워크로드가 동시에 발생하면서 자원 배분의 복잡성이 크게 높아졌기 때문이다.
다이나모는 이러한 문제를 해결하기 위해 GPU 간 작업을 자동으로 분산하고 메모리 활용을 최적화하는 기능을 제공한다. 특히 필요에 따라 데이터를 저비용 스토리지로 이동시키고, 이전 연산 과정에서 생성된 정보를 적절한 GPU로 재배치하는 방식으로 불필요한 연산을 줄인다.
성능 개선 효과도 강조됐다. 엔비디아에 따르면 다이나모는 블랙웰 GPU 기반 환경에서 AI 추론 성능을 최대 7배까지 끌어올릴 수 있다. 이를 통해 토큰당 비용을 낮추고, AI 서비스의 수익성을 높일 수 있다는 설명이다.
젠슨 황 엔비디아 창립자 겸 최고경영자(CEO)는 "추론은 AI 서비스의 핵심 엔진"이라며 "다이나모는 AI 팩토리를 위한 운영체제 역할을 수행하며 글로벌 규모의 AI 서비스 운영을 가능하게 할 것"이라고 말했다.
엔비디아는 다이나모를 랭체인, vLLM, SGLang 등 주요 오픈소스 프레임워크와 연동해 생태계 확장을 추진한다. 또한 메모리 관리, 데이터 이동, 확장성 개선을 위한 핵심 기능을 모듈 형태로 제공해 개발자가 필요에 따라 활용할 수 있도록 했다.
다이나모 1.0은 전 세계 개발자를 대상으로 금일부터 제공된다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성