2026.03.23 (월)

  • 맑음동두천 1.5℃
  • 맑음강릉 9.3℃
  • 맑음서울 4.8℃
  • 맑음대전 2.7℃
  • 맑음대구 4.0℃
  • 맑음울산 8.6℃
  • 맑음광주 4.7℃
  • 맑음부산 10.6℃
  • 맑음고창 0.6℃
  • 맑음제주 8.3℃
  • 맑음강화 3.7℃
  • 맑음보은 -1.4℃
  • 맑음금산 -1.0℃
  • 맑음강진군 2.1℃
  • 맑음경주시 1.4℃
  • 맑음거제 4.6℃
기상청 제공

기본분류

웨카, 엔비디아 BlueField-4 STX에서 더 낮은 토큰당 비용으로 토큰 출력 극대화

(굿모닝베트남미디어) 뉴럴메시 및 증강 메모리 그리드의 엔비디아 STX 통합으로 동일한 GPU 환경에서 토큰 생산량 6.5배 증가, AI 기업의 추론 비용 대폭 절감

 

캘리포니아 산호세 및 캠벨, 2026년 3월 16일 -- GTC 2026: AI 스토리지 및 메모리 시스템 기업 웨카(WEKA)가 3월 16일, 엔비디아(NVIDIA) STX 레퍼런스 아키텍처와 자사 뉴럴메시™(NeuralMesh™) 소프트웨어의 통합을 발표했다. 뉴럴메시에서 구동되는 웨카의 혁신적인 증강 메모리 그리드™(Augmented Memory Grid™) 메모리 확장 기술은 엔비디아 STX를 지원해 에이전트형 AI 팩토리에 고처리량 콘텍스트 메모리 스토리지를 제공하며, 세션, 도구 및 작업 전반에 걸쳐 장문 콘텍스트 추론을 원활하게 구현한다. NVIDIA Vera Rubin NVL72, NVIDIA BlueField-4, 그리고 NVIDIA Spectrum-X 이더넷을 활용한 엔비디아 STX 기반 뉴럴메시 솔루션은 콘텍스트 메모리에서 초당 토큰 수를 4~10배 향상시키는 동시에, AI 워크로드에 대해 초당 최소 320GB 읽기 및 150GB 쓰기 처리량을 지원할 것으로 예상되며, 이는 기존 AI 스토리지 플랫폼 처리량의 두 배 이상이다.

 

 

공유 KV 캐시 인프라로 추론 비용 문제 해결

 

에이전트형 시스템, 특히 소프트웨어 엔지니어링 애플리케이션의 확장은 냉혹한 진실을 드러낸다. 오늘날 AI 경제성은 메모리 인프라 계층에서 결정된다는 것이다. 모든 대규모 추론 플릿은 메모리 한계에 직면한다. GPU의 제한된 고대역폭 메모리(HBM)가 빠르게 소진되고, 키-값(KV) 캐시가 삭제되며, 콘텍스트가 손실되고, 시스템은 이미 완료한 작업을 반복하도록 강요받는다. 이러한 아키텍처적 비효율은 추론 비용을 급등시킨다. 해답은 에이전트, 사용자, 세션 전반에 걸쳐 콘텍스트를 유지하는 공유 KV 캐시 인프라다. 이는 중복 연산을 제거하고, 토큰 처리량을 유지하며, 예측 가능한 성능을 보장한다. 공유 KV 캐시 인프라 없이는 동시 사용자와 에이전트가 증가할수록 부담이 커진다. 비용은 오르고, 사용자 경험은 저하되며, 추론 플릿은 규모가 커질수록 운영하기 더 어려워진다. 엔비디아는 콘텍스트 메모리를 위한 STX를 통해 이러한 핵심 추론 병목 문제를 해결하기 위한 청사진을 제시하고 있다.

 

콘텍스트 메모리 스토리지: 에이전트형 AI 팩토리의 기반

 

엔비디아 STX 아키텍처 기반의 웨카 공동 설계 솔루션을 통해 AI 클라우드, 기업 및 AI 모델 개발사는 GPU를 최고 생산성으로 운영하고, 대용량 토큰 생산을 지속하며, 대규모 추론을 보다 에너지 및 비용 효율적으로 만드는 데 필요한 인프라 기반을 배포할 수 있다.

 

퍼머스(Firmus)와 같은 선도적인 AI 혁신 기업 및 클라우드 제공업체들은 이미 뉴럴메시의 증강 메모리 그리드로 추론 경제성을 혁신하고 있다.

 

퍼머스의 다니엘 커니(Daniel Kearney) 최고기술책임자는 "실제 AI는 연구실에서 구동되지 않는다. 전력 제약, 냉각 한계, 끊임없는 워크로드 수요가 존재한다. 퍼머스는 바로 그러한 환경을 위해 만들어졌다. 엔비디아 AI 인프라와 결합한 웨카 증강 메모리 그리드는 초당 최대 6.5배 높은 토큰 처리량과 4배 빠른 첫 번째 토큰 생성 시간(TTFT)을 대규모로 제공하며, 동일한 GPU 환경에서 더 높은 성능을 달성할 수 있음을 입증한다. 뉴럴메시와 증강 메모리 그리드를 엔비디아 기반의 AI 팩토리 및 엔비디아 STX 레퍼런스 아키텍처에 통합함으로써, 대규모의 예측 가능하고 효율적인 추론을 위한 가장 빠른 콘텍스트 메모리 네트워크를 제공할 수 있게 될 것"이라고 말했다.

 

뉴럴메시와 엔비디아 STX: 에이전트형 AI를 위한 전용 설계

 

뉴럴메시는 170개 이상의 특허를 기반으로 구축된 웨카의 지능형 적응형 스토리지 시스템이다. 풀스택 STX 레퍼런스 아키텍처 전반에서 구동되며, 조직이 고성능 AI 데이터 서비스를 표준화하고 에이전트형 AI 성과를 가속화하는 데 필요한 차세대 스토리지를 제공한다. 웨카의 증강 메모리 그리드는 GPU 메모리 외부에서 KV 캐시를 풀링하고 유지하는 전용 메모리 확장 계층으로, 추론 워크로드가 증가하더라도 장문 콘텍스트 세션을 안정적으로 유지하고 동시성을 높게 유지한다. GTC 2025에서 처음 공개되어 오늘 뉴럴메시 고객들에게 일반 출시된 증강 메모리 그리드는 NVIDIA Grace CPU와 BlueField-3 DPU 환경에서 슈퍼마이크로(Supermicro)와 함께 검증되어, AI 경제성을 개선하는 다양한 이점을 제공한다:

 

  • 더 빠른 사용자 경험: 뉴럴메시의 증강 메모리 그리드는 첫 번째 토큰 생성 시간을 최대 4~20배 단축해, 실제 부하 상황에서도 AI 에이전트와 애플리케이션의 응답성을 유지한다.
  • 동일한 하드웨어로 더 많은 수익: 인프라 추가 없이 GPU당 6.5배 더 많은 토큰을 처리한다.
  • 대규모에서의 지속적인 성능: 증강 메모리 그리드는 세션, 에이전트 및 콘텍스트 윈도우가 증가하더라도 높은 KV 캐시 적중률을 유지하며, DRAM 전용 아키텍처에서 발생하는 성능 급락을 방지한다.
  • GPU 네이티브 효율성: BlueField-4 통합은 CPU에서 스토리지 데이터 경로를 오프로드해 GPU의 완전한 생산성을 유지하고 I/O 병목을 제거한다.

 

웨카의 리란 즈비벨(Liran Zvibel) 공동 창업자 겸 최고경영자는 "코딩 LLM이 발전하면서 생산성이 100~1000배 증가하는 소프트웨어 엔지니어링 분야의 에이전트형 AI 사용 사례 도입이 전례 없이 확산되고 있다. 코딩 어시스턴트가 거의 변하지 않는 코드베이스와 프롬프트에 대해 반복적으로 호출할 때, 웨카의 증강 메모리 그리드는 콘텍스트 윈도우가 엄청난 길이로 늘어나더라도 중복 프리필을 강제하는 대신 캐싱된 콘텍스트를 재사용한다. 이는 응답 시간을 크게 단축하고 동일한 인프라에서 동시 실행 가능한 사용자 수를 대폭 늘린다"고 말했다. 이어 "웨카는 1년여 전 콘텍스트 메모리 스토리지의 필요성을 처음 파악하고 GTC 2025에서 증강 메모리 그리드를 출시했다. 이제 엔비디아 STX는 조직이 NVIDIA BlueField-4 및 NVIDIA Spectrum-X 이더넷을 포함한 최첨단 엔비디아 베라 루빈(NVIDIA Vera Rubin) 아키텍처에서 스토리지 및 메모리 확장 인프라를 운영할 수 있는 길을 열어준다. 엔비디아 STX용 뉴럴메시에서 증강 메모리 그리드를 구동하면 AI 경제성을 획기적으로 변화시키는 탁월한 성능과 효율성을 직접 실현할 수 있다"고 덧붙였다.

 

출시 정보

 

웨카의 증강 메모리 그리드는 현재 뉴럴메시와 함께 상업적으로 이용 가능하다.

 

오늘날 메모리 한계 문제를 해결하지 않는 조직은 이후 더 어렵고 비싼 방식으로 확장해야 할 것이다. 에이전트 워크로드가 증가하고 콘텍스트 윈도우가 확장됨에 따라, DRAM 전용 아키텍처는 복합적인 비용 문제에 직면한다. 동시 사용자나 세션이 추가될수록 재연산 오버헤드, GPU 유휴 시간, 운영 비용이 증가하기 때문이다. 지금 영구적 KV 캐시를 위한 아키텍처를 구축하는 조직은 기다리는 조직 대비 구조적인 비용 및 성능 우위를 갖게 될 것이다.

 

뉴럴메시에 관한 자세한 내용은 weka.io/NeuralMesh에서 확인할 수 있다.

 

증강 메모리 그리드에 관한 자세한 내용은 weka.io/augmented-memory-grid에서 확인할 수 있다.

 

weka.io/nvidia에서 자세한 내용을 확인하거나, GTC 2026 부스 #1034에서 웨카를 직접 방문할 수 있다.

 

웨카 소개

 

웨카는 지능형 적응형 메시 스토리지 시스템인 뉴럴메시™ 바이 웨카®(NeuralMesh™ by WEKA®)를 통해 조직이 AI 워크플로우를 구축, 운영 및 확장하는 방식을 혁신하고 있다. 워크로드가 확장될수록 느려지고 취약해지는 기존 데이터 인프라와 달리, 뉴럴메시는 확장할수록 더 빠르고 강력하며 효율적으로 변하면서 AI 환경에 동적으로 적응해 엔터프라이즈 AI 및 에이전트형 AI 혁신을 위한 유연한 기반을 제공한다. 포춘(FORTUNE) 50대 기업의 30%가 신뢰하는 뉴럴메시는 주요 기업, AI 클라우드 제공업체, AI 개발사가 GPU를 최적화하고 AI를 더 빠르게 확장하며 혁신 비용을 절감할 수 있도록 지원한다. 자세한 내용은 www.weka.io 또는 링크드인엑스(X)를 팔로우하여 확인할 수 있다.

 

WEKA와 W 로고는 WekaIO, Inc.의 등록 상표다. 본 문서에 포함된 기타 상호는 해당 소유자의 상표일 수 있다.

 

 


베트남

더보기
어린이 한국어 교육부터 교민 평생학습까지, 재외동포 교육 거점 ‘호치민 토요한글학교’개강
[굿모닝베트남] 베트남 호치민에서 재외동포 어린이 교육과 교민 평생학습을 함께 이어가는‘토요한글학교’가 2026년 1학기 운영을 시작한다. 호치민시한국국제학교가 운영하는 호치민시토요한글학교는 2026년 3월 14일부터 6월 27일까지 총 14주 동안 1학기 수업을 진행한다. 토요한글학교는 재외동포 자녀를 위한 한글학교 과정과 교민을 위한 문화 강좌를 함께 운영하는 프로그램으로, 해외 교민 사회에서 보기 드문 복합형 교육 프로그램으로 자리 잡고 있다. 2026년 1학기에는 어린이 387명, 성인 136명이 등록해 지역 교민 사회의 높은 관심을 반영했다. 어린이 대상 한글학교 과정은 재외동포 자녀들이 한국어와 한국 문화를 체계적으로 배우며 한국인으로서의 정체성을 형성할 수 있도록 돕는 데 초점을 맞춘다. 수업 대상은 유치 과정부터 8학년까지이며 총 28개 학급으로 운영된다. 국어 교육을 중심으로 한국 역사와 문화 교육을 함께 진행하고, 학생들의 학년과 한국어 수준을 고려한 반 편성을 통해 단계별 교육이 이루어진다. 호치민시토요한글학교 김명환 교장은 “해외에서 성장하는 아이들에게 한국어는 자신의 뿌리와 정체성을 이해하는 중요한 기반”이라며 “토요한글학교가 재외동포

경제

더보기
비댁스, 2년 연속 ISMS 인증 취득…‘법인 전용 커스터디’ 보안 표준 확립
[굿모닝베트남] 디지털 자산 커스터디 전문기업 비댁스(BDACS)가 한국인터넷진흥원(KISA)으로부터 정보보호 관리체계(ISMS) 인증을 2년 연속 유지하며 글로벌 수준의 보안 역량을 다시 한번 공식 인정받았다. ISMS 인증은 가상자산 사업자(VASP)가 안전한 정보보호 관리 체계를 갖췄음을 증명하는 국가 공인 제도로, 비댁스는 이 기준을 2년 연속 충족하며 자산 수탁 및 관리 전반에 걸친 보안 안정성을 재확인했다. 특히 비댁스는 MPC(다자간 연산) 기술과 엄격한 콜드월렛 관리 체계를 결합한 하이브리드 보안 솔루션을 통해 법인 고객의 자산을 철저히 보호하고 있다. 최근 일부 가상자산 탈취 및 유출 사고가 잇따르며 디지털 자산 관리 체계에 대한 우려가 커지는 가운데, 전문성을 갖춘 제3자 수탁(커스터디) 서비스가 근본적인 해결책으로 부상하고 있다. 비댁스는 커스터디 업계 최고 수준의 물리적·기술적 보안 환경을 바탕으로 자산 관리의 투명성을 높이고, 글로벌 스탠다드에 부합하는 리스크 관리 시스템을 통해 기관 투자자를 위한 강력한 안전장치를 제공한다. 비댁스는 설립 이래 법인 및 기관 투자자에게 특화된 ‘프라임 커스터디 솔루션(Prime Custody Solu

문화연예

더보기
BTS 광화문서 ‘왕의 귀환’…역사적 컴백 콘서트 전 세계 주목
[굿모닝미디어] 세계적인 K-팝 그룹 BTS가 서울 광화문 광장에서 개최한 무료 컴백 콘서트 ‘아리랑’을 통해 전 세계 음악 시장에 강렬한 복귀를 선언했다. 약 4년 만에 열린 이번 공연은 단순한 콘서트를 넘어 한국 문화와 K-팝의 위상을 동시에 입증한 역사적인 무대로 평가된다. 3월 21일 저녁 열린 공연에는 약 4만~4만 2천 명의 관객이 운집하며 광화문 일대가 거대한 축제의 장으로 변모했다. 서울시 당국에 따르면 예상보다 다소 적은 규모였지만, 광장을 가득 메운 팬들의 열기는 ‘글로벌 스타’ BTS의 영향력을 다시 한 번 실감케 했다. 이번 공연의 백미는 ‘왕의 길’ 퍼포먼스였다. BTS 멤버들은 근정문, 흥례문, 광화문을 거쳐 이어지는 상징적인 동선을 따라 등장하며 마치 왕의 행차를 연상시키는 압도적인 카리스마를 선보였다. 전통과 현대를 결합한 연출은 관객들에게 깊은 인상을 남겼다. 약 1시간 동안 진행된 콘서트에서 BTS는 신곡 ‘스윔’, ‘바디 투 바디’, ‘훌리건’, ‘에일리언즈’, ‘에프와이이에이’를 비롯해 ‘버터’, ‘다이너마이트’ 등 글로벌 히트곡을 연이어 선보이며 완성도 높은 무대를 펼쳤다. 짧은 공연 시간이었지만 팬들에게는 잊지 못할 순