지식/인사이트
초대형 AI 학습 시 메모리 부족? ETRI "옴니익스텐드로 거뜬"
등록일: 2026-01-09 09:02:45
작성자: 관리자

이더넷 기반 메모리 기술 개발 성능·확장성 혁신
옴니익스텐드 공개, RISC-V 유럽·북미서 기술력 입증

옴니익스텐드 기술을 개발한 ETRI 연구진. 왼쪽부터 차승준 책임연구원, 김강호 본부장, 석성우 책임연구원, 고광원 실장.[사진= ETRI]

옴니익스텐드 기술을 개발한 ETRI 연구진. 왼쪽부터 차승준 책임연구원, 김강호 본부장, 석성우 책임연구원, 고광원 실장.[사진= ETRI]

국내 연구진이 초대형 인공지능(AI) 학습의 고질적 난제인 '메모리 장벽(memory wall)'을 근본적으로 해결할 수 있는 핵심 기술을 내놨다. GPU 연산 성능이 높아질수록 상대적으로 더 심각해지는 메모리 부족과 데이터 병목 문제를, 표준 이더넷(Ethernet) 기반의 메모리 확장으로 돌파했다는 점에서 차세대 AI·빅데이터 인프라의 전환점이 될 기술로 평가된다.

한국전자통신연구원(ETRI·방승찬)은 초대형 AI 학습 환경에서 GPU 메모리 한계와 데이터 이동 병목을 동시에 해소하는 이더넷 기반 메모리 확장 기술 옴니익스텐드(OmniXtend)를 개발했다고 8일 밝혔다.

최근 초대형 언어모델(LLM)과 고성능 컴퓨팅(HPC) 수요가 급증하며 처리 데이터 규모가 폭발적으로 커지고 있다. 그러나 GPU 성능이 아무리 향상돼도, 탑재 메모리가 부족하면 연산 효율이 급락하는 ‘메모리 장벽’은 여전히 AI 학습의 최대 병목으로 남아 있었다.

옴니익스텐드는 이 문제를 서버와 가속기(Device)에 흩어진 메모리를 네트워크 전반에서 하나의 대용량 메모리 풀(pool)처럼 공유하는 방식으로 해결한다. 각 장비의 메모리를 이더넷으로 묶어 필요할 때 유연하게 확장·활용할 수 있어, 대형 모델일수록 효과가 커진다.

기존 고속 직렬 인터페이스(PCIe) 기반 구조는 장비 간 연결 거리와 확장성에 제약이 있었다. 반면 옴니익스텐드는 이더넷 스위치를 활용해 물리적으로 떨어진 다수의 장비를 하나의 메모리 풀로 결합할 수 있어, 초대규모 AI 환경에 적합한 고확장성을 제공한다. 전용 장비 없이 표준 이더넷을 활용한다는 점에서 구축·운영 비용 절감 효과도 크다.

ETRI는 FPGA 기반 메모리 확장 노드, 이더넷 기반 메모리 전송 엔진 등 핵심 요소기술을 구현해 안정적 동작을 검증했다. 실제 시연에서는 이더넷 환경에서 여러 장비가 실시간으로 서로의 메모리에 접근하는 모습을 성공적으로 보여줬다.

대규모 언어모델(LLM) 기반 연산 부하 테스트 결과도 주목된다. 메모리가 부족한 환경에서는 LLM 추론 성능이 크게 저하됐지만, 이더넷으로 메모리를 확장하자 성능이 2배 이상 회복됐다. 충분한 메모리를 갖춘 기존 환경과 유사한 처리 성능을 유지할 수 있음을 입증한 셈이다.

ETRI는 이 기술을 프랑스 파리에서 열린 RISC-V Summit 유럽 2025와 미국 샌타클라라에서 열린 RISC-V Summit North America 2025에서 잇따라 공개해 국제적 관심을 끌었다. 아울러 CHIPS Alliance(리눅스 재단 산하) 인터커넥트 워킹그룹을 주도하며, AI 네트워킹·메모리 확장을 위한 오픈소스 표준 정립과 확산에도 힘쓰고 있다.

ETRI는 향후 데이터센터 하드웨어·소프트웨어 기업을 중심으로 기술이전을 추진해 상용화를 도모할 계획이다. AI 학습·추론 서버, 메모리 확장 장치, 네트워크 스위치 등에 적용해 차세대 AI 인프라 시장에서 실질적 성과를 창출한다는 목표다. 나아가 차량·선박 등 고신뢰 임베디드 시스템의 대용량 메모리 연결망으로 확장하고, NPU·GPU·CPU 등 이종 가속기 간 메모리 공유를 고도화하는 후속 연구도 병행한다.

김강호 초성능컴퓨팅연구본부장은 "신경망처리장치(NPU)와 가속기 중심의 메모리 인터커넥트 연구를 본격 확대할 계획”이라며 “글로벌 AI·반도체 기업의 차세대 시스템에 적용될 수 있도록 기술 고도화와 국제 협력을 지속하겠다"고 말했다.

이번 연구는 과학기술정보통신부와 정보통신기획평가원(IITP)이 지원하는 'SW컴퓨팅산업원천기술개발사업'의 메모리 중심 차세대 컴퓨팅 시스템 구조 연구 과제의 일환으로 수행됐다.

길애경 기자

원문보기 : https://www.hellodd.com/news/articleView.html?idxno=110490


이전글 슈퍼마이크로, 수냉식 AI 솔루션 위한 랙 스케일 제조 역량 확대
다음글 스스로 판단하는 ‘AI 팩토리’… 반도체 설계속도 20배 빨라져