본문으로 건너뛰기

"NPU" 태그로 연결된 2개 게시물개의 게시물이 있습니다.

NPU 기반 AI 컴퓨팅 및 인프라 기술을 소개합니다.

모든 태그 보기

GPU를 넘어 NPU로: EVA, 리벨리온 ATOM™-Max에서 '전 구간(End-to-End)' 서비스 검증 완료

· 약 2분
Gyulim Gu
Gyulim Gu
Tech Leader

지난 포스팅에서 저는 산업 현장의 24시간 '상시 가동 AI'를 위해 리벨리온(Rebellions) NPU와의 협력을 약속드린 바 있습니다.

https://mellerikat.com/blog/News/rebellions

그리고 오늘, 그 약속이 실질적인 기술적 결실로 맺어졌음을 기쁘게 공유합니다.

mellerikat의 EVA(Evolved Vision Agent)는 최근 리벨리온의 최신 서버용 NPU인 ATOM™-Max 환경에서 Vision 모델, LLM, VLM이 결합된 End-to-End 서비스 동작 검증을 성공적으로 마쳤습니다.


🛠️ 단순 모델 실행을 넘어 '전체 서비스 파이프라인'을 태우다

단순히 특정 모델 하나가 NPU에서 돌아가는 것과, 실제 서비스 전체가 안정적으로 구동되는 것은 차원이 다른 문제입니다. EVA는 이번 검증을 통해 다음의 전 과정을 ATOM™-Max 환경에서 단절 없이 구현했습니다.


카메라 입력 → 객체 탐지(Vision) → 시나리오 해석(VLM) → 상황 판단(LLM) → 알림 및 제어 전송

이는 개별 모델의 벤치마크 점수를 넘어, 실제 운영 환경에서 요구되는 복잡한 AI 파이프라인이 NPU 위에서 완벽하게 제어될 수 있음을 확인한 결과입니다. 리벨리온 측에서도 이번 사례를 "상용 NPU 위에서 VLM 기반 AI 서비스가 실동작한 최초의 사례"로 평가하며 큰 기대감을 나타내고 있습니다.


📈 다음 단계: '스트레스 테스트'를 통한 TCO 혁신의 정량화

성공적인 End-to-End 검증을 마친 EVA는 이제 실제 공장 환경을 가정한 스트레스 테스트 단계에 돌입합니다.

우리는 다수의 카메라가 동시에 입력을 쏟아내는 극한의 상황에서도 시스템의 안정성, 처리량(Throughput), 전력 효율을 정밀하게 분석할 예정입니다. 이를 통해 얻게 될 데이터는 고객사에게 다음과 같은 '실행 가능한 가이드'로 제공됩니다.

  1. 최적의 NPU 구성 표준 제시: 카메라 수와 요구되는 추론 성능에 따른 가장 경제적인 하드웨어 구성 가이드.

  2. GPU 대비 TCO 절감 효과 정량화: 단순 장비 가격이 아닌, 전력 소모와 운영 비용을 포함한 실질적 경제성 분석 결과 제공.

  3. 현장 맞춤형 도입 리스크 최소화: 표준화된 NPU 구성을 통해 도입 시간을 단축하고 확산 속도를 극대화.


✨ 결론: 고비용 GPU 의존도를 낮추고 '지속 가능한 AI'로

이번 검증의 핵심은 "멀티모달 산업 AI가 이제 NPU만으로도 실제 운영이 가능한 수준에 도달했다"는 점입니다.

비싼 GPU 비용 때문에 AI 도입을 망설였던 기업들에게 EVA와 리벨리온의 결합은 가장 현실적이고 강력한 대안이 될 것입니다. 고비용 구조를 깨고 효율적인 비용으로 안전·품질·생산성을 높이는 '지속 가능한 산업 AI의 표준', EVA가 리벨리온과 함께 완성해 나가겠습니다.

Rebellions x EVA - 하드웨어부터 서비스까지 풀스택 결합

· 약 3분
Daniel Cho
Daniel Cho
Mellerikat Leader

👉 EVA 기반의 산업 AI, 성능을 넘어 '경제성'의 답을 찾다

산업 현장에서 AI는 더 이상 필요할 때만 호출되는 기능이 아닙니다.

카메라와 센서가 쉼 없이 생성하는 데이터 흐름 위에서 24시간 중단 없이 추론을 수행하는 '상시 가동 시스템(Always-on)'이어야 합니다.

하지만 Vision-Language Model(VLM)처럼 거대해진 AI 모델을 기존의 비싼 GPU 기반 인프라에서 24시간 운영하는 것은 고객사에게 막대한 비용 부담을 안겨줍니다.

mellerikat EVA는 이 비용의 벽을 허물고 산업 AI의 실질적인 확산을 위해, 리벨리온(Rebellions)과 손을 잡았습니다.


👍 1. NPU: GPU의 한계를 넘는 '가격 경쟁력'과 '전성비'

산업용 VLM 서비스가 확산되기 위해서는 인프라 비용(TCO)의 혁신이 필수적입니다. 리벨리온 NPU는 범용 GPU 대비 뛰어난 효율성으로 이러한 요구를 충족합니다.

  • 독보적인 추론 성능: 리벨리온의 ATOM NPU는 MLPerf 등 글로벌 벤치마크에서 동급 GPU 대비 비전 영역에서 최대 3배 빠른 처리 속도를 증명했습니다.
  • 압도적 전성비와 비용 절감: 24시간 가동되는 환경에서 NPU는 GPU 대비 전력 소모를 50% 이상 낮추면서도 높은 처리량(TPS)을 유지합니다.
    이는 곧 고객의 운영 비용 부담을 직접적으로 낮추는 결과로 이어집니다.
  • VLM 최적화: FlashAttention, PagedAttention 등 최신 거대 모델 최적화 기술이 하드웨어 레벨에서 구현되어, 무거운 VLM도 가볍고 빠르게 동작합니다.

EVA가 리벨리온 NPU 위에서 동작한다는 것은, 고객이 가장 경제적인 비용으로 최첨단 Physical AI를 소유할 수 있음을 의미합니다.


👍 2. VLM 최적화: 다양한 모델 테스트와 기술 검증

mellerikat은 현재 EVA 플랫폼 내에서 다양한 최신 VLM 모델들을 리벨리온 NPU 환경에서 테스트하고 있습니다.

단순히 하드웨어를 교체하는 것에 그치지 않고, 산업 현장의 복잡한 시나리오를 NPU에서 최적의 속도로 처리할 수 있도록 소프트웨어 스택을 고도화하고 있습니다.

이 과정을 통해 현장에 즉시 투입 가능한 수준의 'NPU 기반 VLM 서비스 EVA'를 완성해 나가고 있습니다.


👍 3. LG전자 도입에서 글로벌 공급까지: 단계적 협력 로드맵

mellerikat과 리벨리온의 협업은 단순한 기술 제휴를 넘어 실질적인 비즈니스 확장을 목표로 합니다.

  1. VLM 최적화 고도화: 다양한 최신 VLM 모델을 리벨리온 NPU 상에서 테스트하여 최적의 전성비와 처리 속도를 확보하는 검증 단계를 거치고 있습니다.
  2. LG전자 생산 현장 도입: 검증된 VLM 모델과 NPU 최적화 기술을 바탕으로 LG전자 내 주요 생산 공정 및 안전 관제 시스템에 NPU 기반 AI 도입을 우선적으로 추진합니다.
  3. EVA + NPU 패키지 외부 공급: LG전자에서의 성공적인 레퍼런스를 바탕으로, 향후 외부에 EVA 플랫폼을 공급할 때 리벨리온 NPU를 결합한 통합 솔루션 형태로 제공할 예정입니다.

고객은 복잡한 하드웨어 선정 고민 없이, EVA를 도입하는 것만으로도 최적화된 하드웨어와 플랫폼이 결합된 풀스택 서비스를 합리적인 가격에 누릴 수 있게 됩니다.


👏 결론: 지속 가능한 산업 AI의 표준

EVA와 리벨리온 NPU의 결합은 AI를 단순한 기술 도입이 아닌, 현실적인 비용으로 계속 동작하는 서비스 구조로 완성하기 위한 전략적 선택입니다.

하드웨어부터 서비스 플랫폼까지 이어지는 이 강력한 협력을 통해, mellerikat은 산업 현장의 AI 전환을 가속화하고 고객의 인프라 부담을 근본적으로 해결하는 파트너가 되겠습니다.