2025년 엔비디아 블랙웰(Blackwell)이 AI 서버 시장을 뜨겁게 달굴 예정이다. 내년까지 GB200 출하량이 6만대에 이를 것으로 예상되는 가운데, 효율적인 데이터센터 열 관리 솔루션 채택이 촉진될 것으로 전망된다.
▲엔비디아 블랙웰 플랫폼 전력소비량(자료=트렌드포스)
GB200 NVL72, 랙당 약 140kW 전력 소모
고성능 AI 서버, 액체 냉각 방식 채택 ↑
GaN 반도체, 데이터센터 전원공급장치 탑재
2025년 엔비디아 블랙웰(Blackwell)이 AI 서버 시장을 뜨겁게 달굴 예정이다. 내년까지 GB200 출하량이 6만대에 이를 것으로 예상되는 가운데, 효율적인 데이터센터 열 관리 솔루션 채택이 촉진될 것으로 전망된다.
트렌드포스가 지난 30일 발표한 보고서에 따르면, 2024년 말부터 엔비디아가 CSP(클라우드 서비스 제공업체, Cloud Service Provide)를 타겟으로 하는 GB200 AI 서버 솔루션을 출시한다. 이는 HGX, GB200 Rack, MGX를 포함함으로써 기존 호퍼(Hopper) 플랫폼에서의 전환이 예고된다.
■ 엔비디아 블랙웰, 남다른 전력 소모
2025년 엔비디아 GB200 NVL36 출하량이 6만여개에 도달해 GPU 사용량이 약 220만대에 이를 것으로 예측된다. 이는 엔비디아 하이엔드 GPU 제품 비중의 80%를 차지하는 양이다.
그러나 여기에는 변수가 있다. 냉각 솔루션의 안정적 운영이 가능하냐는 문제다. 2025년 출시될 GB200 NVL72는 호퍼 H100에 비해 약 25% 수준의 전력을 활용해 전성비가 향상됐지만, 랙당 약 140kW의 전력을 소비한다. 랙당 36개 또는 72개 GPU가 꽂히기 때문에 엄청난 전력을 소모한다.
이에 따라 데이터센터 열 관리 및 효율을 증대하는 냉각 솔루션이 필수적으로 요구될 것으로 보인다. 최근 업계는 기존 공기 냉각(공랭식) 시스템에서, 액체 냉각(수랭식) 시스템에 주목하고 있다. 보고서는 주요 CSP가 블랙웰 기반 AI 서버를 구축하는 경우, 액체 냉각 솔루션의 보급률은 약 10%를 넘어설 것으로 전망했다.
엔비디아는 랙 온도를 일정 범위 내로 유지하기 위해 냉각수를 조절하는 냉각수 분배 장치(CDU)를 공급하는 ‘버티브(Vertiv)’와 지속적인 테스트를 거치고 있다고 밝혔다.
■ 공기 냉각(공랭식), 액체 냉각(수랭식), 액침 냉각 최적 선택은
▲SKT 직원들이 인천사옥에 설치된 액침냉각 테스트 장비를 점검하는 모습 (사진=SKT)
공기 냉각은 차가운 공기를 순환시키거나 팬을 통해 냉각하는 시스템이다. 액체 냉각은 이보다 복잡하다. 유사한 방식이지만 바람이 아닌 차가운 냉각수가 서버가 설치된 장비까지 들어가는 원리다. 열 교환기가 서버가 설치된 장비에 부착되고, 열을 많이 발생하는 층까지 액체가 들어가 냉각한다. 액체 냉각은 공기 냉각에 비해 냉각 효율이 높아 고성능 기기에 적합하다.
에퀴닉스 장혜덕 대표는 “AI 컴퓨팅 발달로 인해 초고밀도로 랙을 직접화 시키는 추세다. 엔비디아 블랙웰도 훨씬 더 작은 규모로 공간을 차지하며, 이때 액체 냉각이 기본적으로 탑재될 것”이라고 말했다.
에퀴닉스는 약 70여개 도시에 위치한 데이터센터 중 약 100곳 이상에서 액체 냉각을 지원한다. 장 대표는 “지난 1월 개소한 SL4를 비롯해 향후 새롭게 구축할 데이터센터는 액체 냉각이 바로 적용될 수 있도록 설계하고 있다”고 말했다.
액침 냉각은 액체 냉각의 일종으로, 말 그대로 액체에 서버를 담그는 방식이다. 전기가 통하지 않고, 열전도가 높은 특수 냉각유 속에 서버를 직접 넣는다. 현실적으로 가장 어렵지만 가장 효율이 좋다고 알려졌다. SKT는 “공랭식과 액침 냉각 방식에서 진행한 서버 테스트에서 성능에 차이가 없었고, 공랭식 대비 액침 냉각에서 서버 전력 절감이 확인됐다”고 밝혔다.
■ 국가별 다르게 채택되는 냉각 솔루션
액체 냉각과 액침 냉각은 모두 높은 효율을 제공하며, 국가별 환경에 따라 다르게 채택된다. 예컨대 AI 서버의 무게가 몇 톤 이상이기 때문에 데이터센터가 1층인 미국에서는 적용되기 적합하다.
그러나 우리나라를 비롯한 아시아, 유럽의 데이터센터는 고층이기 때문에 무게의 하중에 압박을 받아 오히려 비용이 더 들어갈 수 있다. 또한 물이 귀한 국가에서는 액체 냉각보다 공기 냉각을 채택하는 경우가 있다.
최근에는 데이터센터에서 발생하는 열 자체를 이용하는 방식을 채택하고 있다. 그 동안 데이터센터를 가동할 때 섭씨 30도가 넘는 열로 인해 부품이 손상되는 것을 막기 위해 열을 20~25도로 낮추었다면, 현재는 장비 성능이 향상돼 27~32도까지 올릴 수 있다.
장 대표는 “온도 1도가 별 것 아닌 것처럼 느껴지지만, 전 세계 260개가 넘는 데이터센터를 생각하면 이로 인한 효율이 굉장히 높아진다”고 말했다.
또한 유럽에서는 데이터센터의 열을 활용해 커뮤니티에 기여하고 있다. 예컨대 파리 올림픽에서 근처의 데이터센터 열을 활용해 파리 올림픽 수영장 물을 데웠다. 또한 대학교 기숙사에 난방을 하기 위해 데이터센터 구축 전부터 지역사회 내에서 인프라를 조성하기 위해 협업하기도 한다.
■ GaN 반도체, AI 데이터센터로 진출
▲인피니언 전원공급장치
(사진=인피니언)
데이터센터 효율을 높이기 위한 방안으로 전원공급장치(PSU) 성능을 높이는 방안도 있다. 이때 ‘GaN(질화 갈륨)’ 소재가 주목할 만하다. 디지타임즈에 따르면, 데이터센터 및 로봇 공학과 같이 고주파 스위칭이 중요한 산업 분야에서 GaN은 새로운 틈새 시장을 개척하고 있다.
GaN 및 SiC(실리콘 카바이드)와 같은 복합 반도체는 기존 전력 부품에 탑재되는 실리콘(Si)보다 높은 전류, 전압 및 주파수 문제를 처리하는 성능이 뛰어나다. 특히 GaN은 넓은 밴드갭으로 고온, 고전압 환경에서 안정적으로 작동한다. 고주파에서도 SiC보다 효율적이다. GaN은 소형 크기, 높은 효율성으로 고속 충전기 등에 탑재되고 있다.
인피니언은 지난 5월 AI 데이터센터 시스템 냉각 솔루션을 위한 PSU 로드맵을 28일 발표한 바 있다. 이 PSU에는 3kW 및 3.3kW 출력부터, 8kW 및 12kW 제품이 포함된다.
인피니언은 “현재 하이엔드 GPU는 칩 당 최대 1kW를 필요로 하며, 2030년에 가까워지면 2kW 이상에 달할 것으로 전망된다”고 말했다. 인피니언이 2025년 1분기 공급 시작을 예고한 8kW PSU는 최대 300kW 이상의 출력을 가진 랙을 지원할 수 있다.
인피니언은 “세 가지 반도체 재료인 Si, SiC, GaN의 독특한 조합을 통해 개발한 PSU는 전력 소비와 CO2 배출을 줄여 운영 비용을 줄이고, 기존 서버 전원공급장치를 대체해 효율을 높일 수 있다”고 설명했다.