GTC 2026 분석 리포트 발간…AI 중심축, 학습에서 추론으로 이동
GPU 넘어 CPU·HBM·데이터센터·냉각 인프라까지 수혜 확산
토스증권 리서치센터는 지난 3월 미국 산호세에서 열린 엔비디아 AI 개발자 콘퍼런스 'GTC 2026'을 심층 분석한 'GTC 딥다이브 - 차세대 컴퓨팅, 추론, 그리고 AI 에이전트' 리포트를 발간했다고 밝혔다. 리서치센터는 이번 리포트를 통해 AI 산업이 단순 모델 성능 경쟁의 시대를 지나, 추론과 인프라, 생태계 중심의 '제2막'으로 진화하고 있다고 분석했다.
토스증권 리서치센터는 AI 산업이 특정 기업의 독식 보다는 인프라, 플랫폼, 모델, 서비스 등 각 영역별 핵심 플레이어가 공존하는 형태로 확장되고 있다고 진단했다. 특히 AI 수요 확대와 효율 개선이 사용량 증가로 이어짐에 따라, 메모리 반도체 기업들이 수혜를 받을 것으로 내다봤다.
특히 최근에는 AI 산업의 중심축이 학습(Training)에서 추론(Inference)으로 이동하고 있다는 분석이다. 단순 GPU 성능보다 제한된 전력과 시간 안에서 연산 효율을 높이는 것이 핵심 경쟁력으로 떠오르면서, GPU뿐 아니라 CPU와 메모리 등 AI 인프라 전반의 수요 확대가 이어질 것이라는 설명이다.
리서치센터는 이러한 흐름 속에서 AI 데이터센터가 단순 서버 공간을 넘어 'AI 팩토리'로 진화하고 있다고 진단했다. 데이터와 전력은 원재료, GPU는 기계, AI 모델은 생산 라인 역할을 하며, AI 공장의 효율적 운영을 위해 전력 효율과 냉각 기술 등 인프라 병목 해소 중요성도 더욱 커지고 있다고 강조했다.
이와 함께 엔비디아는 네모클로(NemoClaw) 생태계를 통해 GPU 판매를 넘어 AI 에이전트 생태계까지 영향력을 확대하고 있으며, 이러한 구조 속에서 삼성전자와 SK하이닉스 등 국내 메모리 기업들의 중요성도 다시 부각되고 있다고 덧붙였다.
리서치센터는 GPU 기반 HPC(고성능 컴퓨팅)와 양자컴퓨팅이 결합되는 '하이브리드 컴퓨팅' 변화에도 주목했다. 엔비디아는 NVQLink와 CUDA-Q를 통해 양자컴퓨팅을 기존 데이터센터 인프라 위에서 작동하는 구조로 확장하고 있으며, GPU와 양자컴퓨터는 경쟁이 아닌 협력 관계로 발전하고 있다는 설명이다.
이 과정에서 AI와 데이터센터 인프라 확장이 양자컴퓨팅 범용화 가능성을 높이고 있으며, 엔비디아가 AI에 이어 차세대 컴퓨팅에서도 핵심 인프라 공급자로서의 입지를 강화할 수 있다고 분석했다.
이영곤 토스증권 리서치센터장은 "이번 GTC를 통해 AI 산업의 경쟁력이 단순 모델 성능보다 인프라와 효율과 생태계 확장에 의해 결정되는 패러다임 전환을 확인할 수 있었다"며 "투자자들은 AI 모델 자체뿐만 아니라 메모리, 데이터센터, 전력 등 인프라 밸류체인 전반의 변화를 함께 살펴볼 필요가 있다"고 말했다.
Copyright ⓒ 메트로신문 & metroseoul.co.kr
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성