Rebellions x EVA - 하드웨어부터 서비스까지 풀스택 결합
· 약 3분

👉 EVA 기반의 산업 AI, 성능을 넘어 '경제성'의 답을 찾다
산업 현장에서 AI는 더 이상 필요할 때만 호출되는 기능이 아닙니다.
카메라와 센서가 쉼 없이 생성하는 데이터 흐름 위에서 24시간 중단 없이 추론을 수행하는 '상시 가동 시스템(Always-on)'이어야 합니다.
하지만 Vision-Language Model(VLM)처럼 거대해진 AI 모델을 기존의 비싼 GPU 기반 인프라에서 24시간 운영하는 것은 고객사에게 막대한 비용 부담을 안겨줍니다.
mellerikat EVA는 이 비용의 벽을 허물고 산업 AI의 실질적인 확산을 위해, 리벨리온(Rebellions)과 손을 잡았습니다.
👍 1. NPU: GPU의 한계를 넘는 '가격 경쟁력'과 '전성비'
산업용 VLM 서비스가 확산되기 위해서는 인프라 비용(TCO)의 혁신이 필수적입니다. 리벨리온 NPU는 범용 GPU 대비 뛰어난 효율성으로 이러한 요구를 충족합니다.
- 독보적인 추론 성능: 리 벨리온의 ATOM NPU는 MLPerf 등 글로벌 벤치마크에서 동급 GPU 대비 비전 영역에서 최대 3배 빠른 처리 속도를 증명했습니다.
- 압도적 전성비와 비용 절감: 24시간 가동되는 환경에서 NPU는 GPU 대비 전력 소모를 50% 이상 낮추면서도 높은 처리량(TPS)을 유지합니다.
이는 곧 고객의 운영 비용 부담을 직접적으로 낮추는 결과로 이어집니다. - VLM 최적화: FlashAttention, PagedAttention 등 최신 거대 모델 최적화 기술이 하드웨어 레벨에서 구현되어, 무거운 VLM도 가볍고 빠르게 동작합니다.
EVA가 리벨리온 NPU 위에서 동작한다는 것은, 고객이 가장 경제적인 비용으로 최첨단 Physical AI를 소유할 수 있음을 의미합니다.
👍 2. VLM 최적화: 다양한 모델 테스트와 기술 검증
mellerikat은 현재 EVA 플랫폼 내에서 다양한 최신 VLM 모델들을 리벨리온 NPU 환경에서 테스트하고 있습니다.
단순히 하드웨어를 교체하는 것에 그치지 않고, 산업 현장의 복잡한 시나리오를 NPU에서 최적의 속도로 처리할 수 있도록 소프트웨어 스택을 고도화하고 있습니다.
이 과정을 통해 현장에 즉시 투입 가능한 수준의 'NPU 기반 VLM 서비스 EVA'를 완성해 나가고 있습니다.
