인공지능(AI) 컴퓨팅 기술을 주도하는 엔비디아가 최근 컴퓨텍스 2023에서 AI 시장을 타겟으로 하는 △제품과 사양 △파트너사 협력 지원 △레퍼런스 등을 대거 공개했다. 생성형 AI가 만들어낸 AI 시장의 확대를 등에 업고 엔비디아가 광폭 행보를 보이고 있다.
■ DGX GH200 AI 슈퍼컴퓨터 발표
엔비디아가 대용량 메모리 AI 슈퍼컴퓨터 DGX GH200을 발표했다. DGX 슈퍼컴퓨터는 엔비디아 GH200 그레이스 호퍼 슈퍼칩과 엔비디아 NVLink 스위치 시스템을 탑재하고, 생성형 AI 언어 애플리케이션과 추천 시스템, 데이터 애널리틱스 워크로드에 사용될 차세대 거대 모델들의 개발을 지원한다.
DGX GH200의 공유 메모리 공간은 NVLink 인터커넥트 테크놀로지와 NVLink 스위치 시스템으로 GH200 슈퍼칩 256개를 결합해 단일 GPU로 기능하게 한다. 이를 통해 1엑사플롭의 성능과 144테라바이트의 공유 메모리를 제공하는데, 이는 단일 엔비디아 DGX A100 시스템 메모리의 500배에 가까운 용량이다.
구글 클라우드와 메타, 마이크로소프트는 업계 최초로 DGX GH200을 도입해 생성형 AI 워크로드 역량을 탐구하고 있는 것으로 전해졌다. 엔비디아는 또한 클라우드 서비스 제공업체와 기타 하이퍼스케일러가 DGX GH200 설계를 청사진으로 삼아 자체 인프라로 커스터마이징 할 수 있도록 지원할 방침이다.
■ 그레이스 호퍼 슈퍼칩, 日 분산 AI 데이터센터에 공급
엔비디아는 생성형 AI와 5G/6G 애플리케이션용 플랫폼 구축에 소프트뱅크와의 협력을 발표했다. 소프트뱅크는 Arm 네오버스(Neoverse) 기반 엔비디아 GH200 그레이스 호퍼(Grace Hopper) 슈퍼칩을 해당 플랫폼에 적용해 일본 전 지역의 새로운 분산 AI 데이터센터에 배포할 계획...(더보기)
#AI반도체 #챗GPT #AI서버 #AI컴퓨팅 #인공지능가속기 #반도체수요 #AI수요
그레이스호퍼 슈퍼칩, AI 슈퍼컴퓨터·데이터센터 등 채택
첨단 전자 제조 산업 DX, 광범위한 생성AI 생태계 구축
인공지능(AI) 컴퓨팅 기술을 주도하는 엔비디아가 최근 컴퓨텍스 2023에서 AI 시장을 타겟으로 하는 △제품과 사양 △파트너사 협력 지원 △레퍼런스 등을 대거 공개했다. 생성형 AI가 만들어낸 AI 시장의 확대를 등에 업고 엔비디아가 광폭 행보를 보이고 있다.
■ DGX GH200 AI 슈퍼컴퓨터 발표
▲대용량 메모리 AI 슈퍼컴퓨터 DGX GH200(사진:엔비디아)
엔비디아가 대용량 메모리 AI 슈퍼컴퓨터 DGX GH200을 발표했다. DGX 슈퍼컴퓨터는 엔비디아 GH200 그레이스 호퍼 슈퍼칩과 엔비디아 NVLink 스위치 시스템을 탑재하고, 생성형 AI 언어 애플리케이션과 추천 시스템, 데이터 애널리틱스 워크로드에 사용될 차세대 거대 모델들의 개발을 지원한다.
DGX GH200의 공유 메모리 공간은 NVLink 인터커넥트 테크놀로지와 NVLink 스위치 시스템으로 GH200 슈퍼칩 256개를 결합해 단일 GPU로 기능하게 한다. 이를 통해 1엑사플롭의 성능과 144테라바이트의 공유 메모리를 제공하는데, 이는 단일 엔비디아 DGX A100 시스템 메모리의 500배에 가까운 용량이다.
구글 클라우드와 메타, 마이크로소프트는 업계 최초로 DGX GH200을 도입해 생성형 AI 워크로드 역량을 탐구하고 있는 것으로 전해졌다. 엔비디아는 또한 클라우드 서비스 제공업체와 기타 하이퍼스케일러가 DGX GH200 설계를 청사진으로 삼아 자체 인프라로 커스터마이징 할 수 있도록 지원할 방침이다.
■ 그레이스 호퍼 슈퍼칩, 日 분산 AI 데이터센터에 공급
▲엔비디아, 소프트뱅크와 AI데이터센터 협력(이미지:엔비디아)
엔비디아는 생성형 AI와 5G/6G 애플리케이션용 플랫폼 구축에 소프트뱅크와의 협력을 발표했다. 소프트뱅크는 Arm 네오버스(Neoverse) 기반 엔비디아 GH200 그레이스 호퍼(Grace Hopper) 슈퍼칩을 해당 플랫폼에 적용해 일본 전 지역의 새로운 분산 AI 데이터센터에 배포할 계획이다.
소프트뱅크는 생성형 AI 애플리케이션과 서비스를 전세계에 신속하게 배포할 수 있는 기반을 구축한다. 그리고 엔비디아와의 협력을 통해 다중 테넌트 공통 서버 플랫폼에서 생성형 AI와 무선 애플리케이션을 호스트할 수 있는 데이터센터를 구축하여 비용을 줄이고 에너지 효율성을 높일 계획이다.
새로운 데이터센터를 통해 기존 데이터센터보다 공간을 전체적으로 더 고르게 분산하며, AI 및 5G 워크로드를 모두 처리할 것이라고 전했다. 이를 통해 낮은 지연시간과 절감된 에너지 비용으로 최대 용량 동작을 용이하게 할 것으로 기대했다.
미야카와 준이치(Junichi Miyakawa) 소프트뱅크 회장 겸 CEO는 “사회와 AI가 공존하는 시대에 접어들면서 데이터 처리와 전력 수요가 급증할 것”이라며 “소프트뱅크는 일본의 초디지털화 사회를 지원하기 위한 차세대 소셜 인프라를 제공할 것”이라고 말했다.
■ 엔비디아 MGX, 데이터센터 가속컴퓨팅 요구 충족
▲ 엔비디아 MGX(사진:엔비디아)
전세계 데이터센터의 다양한 가속 컴퓨팅 요구에 부응하기 위해 엔비디아는 MGX 서버 사양을 공개했다. 해당 사양은 시스템 제조사에 모듈식 참조 아키텍처를 제공해 인공지능, 고성능 컴퓨팅(HPC), 옴니버스(Omniverse) 애플리케이션에 맞는 다양한 서버 변형을 빠르고 경제적으로 구축할 수 있게 한다.
MGX는 다양한 폼팩터에서 작동하며 현재 및 미래 세대의 엔비디아 하드웨어와 호환된다. 호환되는 폼팩터로 △섀시: 1U, 2U, 4U(공냉식 또는 수냉식) △GPU: 최신 H100, L40, L4를 포함한 엔비디아 GPU 전체 포트폴리오 △CPU: 엔비디아 그레이스 CPU 슈퍼칩, GH200 그레이스 호퍼 슈퍼칩, x86 CPUs △네트워킹: 엔비디아 블루필드(BlueField)-3 DPU, 커넥트X(ConnectX)-7 네트워크 어댑터가 있다.
MGX는 엔비디아 제품과의 유연한 다세대 호환성을 제공해 시스템 빌더가 기존 설계를 재사용하고 고가의 재설계 없이 차세대 제품을 쉽게 채택할 수 있도록 하며, 이러한 호환성은 엔비디아 HGX와의 가장 큰 차이점이다. 반면 HGX는 최고 수준의 AI 및 HPC 시스템을 만들기 위해 확장 가능하도록 맞춤화된 NVLink로 연결된 다중 GPU 베이스보드를 기반으로 한다.
카우츠브 상하니(Kaustubh Sanghani) 엔비디아 GPU 제품 담당 부사장은 “기업들은 특정 비즈니스와 애플리케이션 요구에 맞는 데이터센터를 설계할 때 더 많은 가속 컴퓨팅 옵션을 찾는다”며 “고객들이 기업용 AI를 부트스트랩(bootstrap) 하는 데 있어 상당한 시간과 비용을 절약할 수 있도록 도움을 주고자 MGX를 개발했다”고 말했다.
■ 생성형 AI와 옴니버스, IT제조 첨단 공장 DX
▲엔비디아, 첨단 제조 공장 디지털화(사진:엔비디아)
엔비디아는 레퍼런스 워크플로우로 제조 산업에서 디지털전환을 가속하는 IT 기업들을 소개했다. 젠슨 황 엔비디아 CEO는 컴퓨텍스 2023 기조연설에서 전자 제조업계 최초의 시도인 완전 디지털화된 스마트 공장의 데모를 선보였다.
이 워크플로우에는 컴퓨터 보조 디자인 앱을 비롯해 생성형 AI를 위한 최첨단 프레임워크와 API를 연결하는 엔비디아 옴니버스, 로봇의 시뮬레이션과 검증을 위한 엔비디아 아이작 심 애플리케이션, 그리고 자동 광학 검사가 가능한 엔비디아 메트로폴리스 비전 AI 프레임워크가 소개됐다.
△폭스콘 인더스트리얼 인터넷 △이노디스크(Innodisk) △페가트론(Pegatron) △콴타(Quanta) △위스트론 등이 새로운 레퍼런스 워크플로우로 자사 워크셀과 조립 라인 운영의 최적화와 생산비 절감을 도모하고 있는 것으로 전해졌다.
앤드루 샤오(Andrew Hsiao) 페가트론 소프트웨어 R&D 부문 부사장은 엔비디아 옴니버스와 아이작 심, 메트로폴리스가 “특정 아이디어를 물리 세계에 구현하기에 앞서 가상 세계에서 먼저 AI로 훈련하고 공장의 워크플로우를 개선하며 수많은 시뮬레이션을 실행할 수 있게 해준다”며 “공장 전체를 디지털화하면 로보틱스와 자동화 파이프라인을 처음부터 끝까지 시뮬레이션하는 한편, 시뮬레이션 환경에서 여러 시험을 진행할 수 있어 시간과 비용이 크게 절약된다”고 설명했다.
정보통신 제품 공급사 위스트론은 오토데스크 오토캐드와 레빗, 플렉심의 인풋과 엔비디아 옴니버스로 자동 수신 회선과 오퍼레이션 빌딩의 디지털 트윈을 구축한다. 또한 엔비디아 메트로폴리스와 AI 기반 컴퓨터 비전을 사용해 회로기판 광학 검사의 일부 과정을 자동화하고 있다.
■ 엔비디아, 광범위한 생성AI 생태계 구축
▲젠슨 황 엔비디아 CEO(사진:엔비디아)
엔비디아는 제조용 툴과 서비스의 공급자들과 협력해 워크플로우의 각 차원에 맞는 풀스택의 단일 아키텍처를 구축하고 있다. 에이디링크와 에티나, 딜로이트, 지멘스 등 대형 파트너 생태계가 관련 솔루션의 출시를 돕고 있다.
시스템 차원에서는 엔비디아 IGX 오린이 산업 등급의 하드웨어를 엔터프라이즈급 소프트웨어나 지원과 결합시키는 일체형 엣지 AI 플랫폼을 제공한다. IGX는 엣지 컴퓨팅 고유의 내구성과 저전력 요구 사항을 충족하면서 AI 애플리케이션 개발과 실행 성능을 제공한다.
제조 부문 파트너사인 에이디링크와 어드밴텍 등은 산업과 의료 시장에 서비스를 제공할 IGX 기반 시스템을 개발 중이다. 이 시스템들을 통해 물리 제품 생산 과정에서 디지털화의 이점을 누릴 수 있게 될 전망이다.
플랫폼 차원에서는 옴니버스가 3D, 시뮬레이션, 생성형 AI 공급자들을 서로 연결한다. 일례로 개방형의 개발 플랫폼을 통해 작업팀들은 어도비(Adobe)와 오토데스크, 지멘스(Siemens) 등 자신이 선호하는 애플리케이션 사이의 상호운용성을 확보할 수 있다.
또한 컴퓨텍스 2023 기조연설의 시연에서는 챗GPT와 블렌더 GPT 등 다양한 AI 어시스턴트와 옴니버스를 연결해 3D 워크플로우와 파이썬 애플리케이션 개발을 간소화하는 방법도 소개됐다.
마이크로소프트 애저에서 사용 가능한 서비스형 플랫폼인 엔비디아 옴니버스 클라우드는 기업 고객들이 풀스택의 옴니버스 소프트웨어 애플리케이션과 엔비디아 OVX 인프라에 액세스해 애저 클라우드 서비스의 확장성과 안전성을 동시에 누릴 수 있게 한다.