디에스앤지, "AI 혁신 계속..엔비디아 최적 서버에 주목"

머니투데이 이유미 기자 2024.06.26 16:12
글자크기
엔비디아가 차세대 AI(인공지능) 반도체 블랙웰(Blackwell)을 공개하면서 이에 최적화된 서버 역시 속속 선을 보이고 있다. AI 인프라 서비스 전문업체 디에스앤지(대표 서정열)는 AI 성능이 점차 향상되면서 이에 맞춘 차세대 서버가 AI의 잠재적 성능에 기여할 수 있음을 강조했다. 최근 슈퍼마이크로가 공개한 '플러그앤플레이 액체 냉각식 AI 슈퍼클러스터'를 일례로 들었다.

디에스앤지 관계자는 "이는 엔비디아의 블랙웰 GPU(그래픽처리장치)에 최적화된 서버"라며 "10U 공냉식 및 4U 수냉식 냉각 서버가 포함된 데다 액체 냉각식 AI 데이터 센터에도 활용 가능하다"고 말했다.



블랙웰은 엔비디아 호퍼 아키텍처의 후속기술이다. 이는 기존 AI 칩의 성능을 크게 개선한 엔비디아의 차세대 제품으로 주목받고 있다. 2080억개의 트랜지스터를 탑재, 최대 10조개의 파라미터로 확장되는 모델에 대한 AI 훈련이 가능하다. 또 실시간 LLM(거대언어모델) 추론 측면에서도 독보적 성능을 자랑한다. 기존 대비 추론 성능은 최대 30배까지 향상할 수 있는 데 반해 비용과 에너지 소비는 1/25로 낮출 수 있어서다.

디에스앤지 관계자는 "슈퍼마이크로는 엔비디아와 긴밀한 협업을 이어온 회사"라며 "AI 혁신을 주도할 대규모 데이터센터 전환에 앞장 서고 있다"고 말했다. 특히 "생성형 AI 활용 극대화를 위해 통합 인프라를 구축하는 등 AI 기술의 접근성을 높이는 데 힘쓰고 있다"고 말했다.



회사 측은 엔비디아와 슈퍼마이크로의 시너지가 돋보이는 제품 중 하나로 'MGX GH200 슈퍼클러스터'를 꼽았다. 이 시스템은 9개의 확장 가능한 서버 랙과 1개의 전용 네트워킹 랙으로 구성돼 있으며, 256개의 강력한 그레이스 호퍼 슈퍼칩을 탑재하고 있다. 엔비디아의 최신 AI 소프트웨어인 △NIM 마이크로서비스 △네모(NeMo) 플랫폼 △AI 엔터프라이즈가 함께 탑재돼 AI 작업의 효율성을 크게 높일 수 있다는 게 특징이다. 아울러 플러그 앤 플레이 확장형 유닛으로 데이터 센터에 쉽게 도입 가능하다. 이는 복잡한 AI 프로젝트의 속도를 끌어올린다.

엔비디아 호퍼 아키텍처 기반의 H200 GPU에 대한 최근 테스트 결과는 AI 혁신에 대한 기대감을 높인다. H200이 '엠엘퍼프(MLPerf) 추론 v4.0 테스트'에서 최고 기록을 낸 것이다. MLPerf는 기계 학습을 뜻하는 ML(머신 러닝)과 성능(Performance)를 합친 의미로, AI 반도체 성능 시험에 있어 중요한 기준이 된다. 점차 성능이 좋아지는 GPU를 뒷받침할 수 있는 슈퍼클러스터 또한 AI 성장의 잠재성을 높일 수 있다고 업계는 보고 있다.

디에스앤지 측은 " 9개월 전 엔비디아의 H100으로 진행한 엠엘퍼프 v3.1 테스트에 비해 2.4배(오프라인 기준), 서버 조건 대비 2.9배 높은 값을 낸 것"이라며 "최근의 테스트는 AI 발전이 더 빨라질 것을 시사한다"고 말했다. 이어 "H200은 물론 올 하반기 출시 예정인 블랙웰에 대한 PoC(기술검증)를 진행할 계획"이라고 덧붙였다.


슈퍼마이크로의 액체 냉각식 AI 슈퍼클러스터/사진제공=디에스앤지슈퍼마이크로의 액체 냉각식 AI 슈퍼클러스터/사진제공=디에스앤지


TOP