AI 데이터 인텔리전스 기업인 DDN이 그록(Grok) LLM의 AI 잠재력을 확장하는 xAI의 프로젝트 콜로서스(Project Colossus)를 위해 엔비디아와 협력한다고 발표했다.
처음에는 10만 개의 엔비디아 호퍼 GPU와 엔비디아 스펙트럼-X 이더넷 네트워킹 플랫폼의 조합으로 구동되던 이 솔루션은 대규모 AI 훈련 중에도 95%의 데이터 처리량 효율성을 유지한다. 콜로서스는 곧 20만 개의 GPU로 확장되어 세계에서 가장 강력한 AI 슈퍼컴퓨터 중 하나로서의 입지를 굳히고 AI가 달성할 수 있는 한계를 넓힐 예정이다.
여러 데이터 홀에 걸쳐 있는 진정한 데이터 메트로폴리스가 된 멤피스 시설은 속도, 규모, 순수 연산 능력에 대한 그록의 요구사항을 충족하도록 설계되었다. 이 인프라는 고층 건물을 세계에서 가장 강력한 AI 엔진 중 하나를 지원하도록 완전히 최적화된 번화한 허브로 전환하는 것이다.
그 핵심은 엔비디아 가속 컴퓨팅 플랫폼으로, 터보차지된 DDN의 첨단 AI 데이터 플랫폼이 DDN의 엑사스케일러(EXAScaler)와 인피니아(Infinia) 솔루션의 성능을 결합한다. 이 설정은 최첨단 AI가 요구하는 규모와 정밀도를 제공한다. 이는 극도의 효율성을 위해 미세 조정되고 집약적인 생성AI 워크로드를 처리하도록 설계됐다.
DDN의 플랫폼은 조직이 모델 훈련과 추론을 확장할 수 있도록 설계되었으며, 간소화된 데이터 패스(DataPath) 기술 덕분에 데이터가 원활하고 효율적으로 흐를 수 있다. 이 설정은 하드웨어, 전력, 냉각 또는 네트워크 자원에 대한 일반적인 부담 없이 데이터 이동을 최대화하여 xAI가 비용을 낮추고 환경 영향을 최소화하면서 콜로서스의 훈련 능력을 확장할 수 있게 한다.
우수한 훈련 능력과 효율성
DDN의 지원을 받는 프로젝트 콜로서스는 AI 모델 훈련 능력과 속도에서 크게 발전했다. 그록은 DDN의 엑사스케일러와 인피니아 솔루션이 원활하게 지원하는 10만 개 GPU의 연산 능력을 활용한다. DDN의 데이터 플랫폼은 훈련 시간을 크게 단축하여 신속한 모델 반복과 업데이트의 유연성을 높인다.
콜로서스와 DDN의 아키텍처를 통해 xAI는 더 큰 데이터세트와 점점 복잡해지는 모델 아키텍처를 처리하여, 이전에는 달성 불가능하다고 여겨진 규모로 자연어 처리와 대화형 AI와 같은 응용 분야에서 획기적인 성능을 이끌어낼 수 있다.
실제 세계 AI 추론 강화
DDN의 고효율 플랫폼은 훈련 외에도 콜로서스의 AI 추론 능력을 증폭시켜 xAI가 강력한 모델을 대규모로 배포할 수 있게 한다. DDN의 간소화된 데이터 경로는 실시간 응용 프로그램의 추론 속도를 높여 X와 같은 플랫폼 전반에서 사용자들이 그록의 영향을 직접 체감할 수 있도록 한다. DDN 솔루션을 활용하여 콜로서스가 달성한 향상된 성능은 그록이 상업적으로 이용 가능한 가장 진보된 AI 시스템 중 하나가 되도록 하여, AI 기반 사용자 경험을 새로운 차원으로 끌어올리고 실제 응용 분야에서 속도와 확장성을 개선한다.
DDN은 세 가지 중요한 수준에서 AI 성공을 가능하게 한다.
① 데이터센터 및 클라우드 최적화 : DDN 솔루션은 GPU 워크로드를 위해 컴퓨팅, 네트워크, 스토리지 전반에 걸쳐 엔드투엔드 최적화를 제공하여 다른 솔루션들에 비해 오버헤드와 비효율성을 75%까지 줄인다. 대규모 언어 모델(LLM)에서 DDN은 생성AI의 데이터 로딩, 체크포인팅, 추론을 최적화하여 10배의 비용 이점을 제공한다.
② AI 프레임워크/LLM/생성AI 가속화 : DDN은 AI 워크플로우의 분석 계층을 가속화하여 제한된 환경에서도 LLM 성능을 최대 10배까지 높인다. 이는 GPU 낭비를 줄이고, 훈련 속도를 높이며, AI 제품의 출시 시간을 단축한다.
③ 데이터 오케스트레이션 및 이동 최적화 : DDN 플랫폼은 에지, 데이터센터, 멀티클라우드 환경 전반에 걸쳐 효율적인 데이터 흐름을 보장한다. 지연 시간을 최소화하고 불필요한 데이터 전송을 줄임으로써 비용을 절감하고 확장성을 높여 AI 기반 혁신을 위한 유연하고 미래 지향적인 인프라를 구축한다.
DDN은 7년 이상 엔비디아와 협력하여 셀린(Selene) 슈퍼컴퓨터부터 시작하여 슈퍼컴퓨팅 혁신을 추진해 왔다. 이 협력은 이오스(Eos) 슈퍼컴퓨터에 대한 지원으로 확대되었으며, 현재는 엔비디아 블랙웰(Blackwell) 플랫폼까지 확장되었다.
DDN의 CEO이자 공동창업자인 알렉스 부자리(Alex Bouzari)는 “DDN의 플랫폼을 엔비디아의 가속 컴퓨팅 플랫폼으로 구동돼, xAI에 가장 야심찬 AI 프로젝트를 발전시키는 데 필요한 기술을 제공하고 있다. DDN의 솔루션은 대규모의 효율성을 높이도록 특별히 설계되었으며, xAI에서의 이번 구축은 고성능, AI 최적화 기술의 능력을 보여준다.”고 말했다.
▷ 원문보기 : https://www.gttkorea.com/news/articleView.html?idxno=14946
제1조(목적)
본 약관은 한국초고성능컴퓨팅포럼(이하 "포럼"이라 한다)이 제공하는 서비스의 이용조건 및 절차, 이용자와 포럼의 권리, 의무, 책임사항과 기타 필요한 사항을 규정함을 목적으로 합니다.
제2조(약관의 효력과 변경)
1. 귀하가 본 약관 내용에 동의하는 경우, 포럼의 서비스 제공 행위 및 귀하의 서비스 사용 행위에 본 약관이 우선적으로 적용됩니다.
2. 포럼은 본 약관을 사전 고지 없이 변경할 수 있고, 변경된 약관은 포럼 내에 공지하거나 E-mail을 통해 회원에게 공지하며, 공지와 동시에 그 효력이 발생됩니다. 이용자가 변경된 약관에 동의하지 않는 경우, 이용자는 본인의 회원등록을 취소(회원탈퇴)할 수 있으며 계속 사용의 경우는 약관 변경에 대한 동의로 간주됩니다.
제3조(약관 외 준칙)
본 약관에 명시되지 않은 사항은 전기통신기본법, 전기통신사업법, 정보통신망 이용촉진 및 정보보호 등에 관한 법률 및 기타 관련 법령의 규정에 의합니다.
제4조(용어의 정의)
본 약관에서 사용하는 용어의 정의는 다음과 같습니다.
1. 이용자 : 본 약관에 따라 포럼이 제공하는 서비스를 받는 자.
2. 가입 : 포럼이 제공하는 신청서 양식에 해당 정보를 기입하고, 본 약관에 동의하여 서비스 이용계약을 완료시키는 행위.
3. 회원 : 포럼에 개인 정보를 제공하여 회원 등록을 한 자로서 포럼이 제공하는 서비스를 이용할 수 있는 자.
4. 비밀번호 : 이용자와 회원ID가 일치하는지를 확인하고 통신상의 자신의 비밀보호를 위하여 이용자 자신이 선정한 문자와 숫자의 조합.
5. 탈퇴 : 회원이 이용계약을 종료시키는 행위.
(... 이하 생략 ...)
1 개인정보의 처리 목적
① 한국초고성능컴퓨팅포럼은(는) 다음의 목적을 위하여 개인정보를 처리합니다. 처리하고 있는 개인정보는 다음의 목적 이외의 용도로는 이용되지 않으며 이용 목적이 변경되는 경우에는 「개인정보 보호법」 제18조에 따라 별도의 동의를 받는 등 필요한 조치를 이행할 예정입니다.
1. 홈페이지 회원가입 및 관리
회원 가입의사 확인, 회원제 서비스 제공에 따른 본인 식별·인증, 회원자격 유지·관리, 서비스 부정이용 방지, 만14세 미만 아동의 개인정보 처리 시 법정대리인의 동의여부 확인, 각종 고지·통지, 고충처리 목적으로 개인정보를 처리합니다.
2. 개인정보의 처리 및 보유 기간
① 한국초고성능컴퓨팅포럼은(는) 법령에 따른 개인정보 보유·이용기간 또는 정보주체로부터 개인정보를 수집 시에 동의받은 개인정보 보유·이용기간 내에서 개인정보를 처리·보유합니다.
② 각각의 개인정보 처리 및 보유 기간은 다음과 같습니다.
1. 홈페이지 회원가입 및 관리
홈페이지 회원가입 및 관리와 관련한 개인정보는 수집.이용에 관한 동의일로부터 준영구적으로 보유.이용됩니다.
(... 이하 생략 ...)
공고일자 : 2023년 07월 03일
시행일자 : 2023년 07월 03일