이 페이지에서
v1.3.2 (April 14, 2026)
호환성: 이 버전은 EVA App v2.7.0 이상이 필요합니다.
새로운 기능
폴리곤 기반 관심영역 처리 추가: 보다 정밀한 영역 기반 필터링을 위해 polygon foot-point 지원을 도입하고, 핸들러 및 프록시 모델 전반에 새로운 interests 인터페이스를 적용했습니다.
임계값 정규화/비정규화 기능 구현: 프록시 서비스 계층에서 threshold 값을 정규화된 값과 비정규화된 값 사이로 변환할 수 있도록 지원합니다.
경계 잘림 제어 옵션 추가: 객체가 이미지 경계에 닿는 경우의 후처리 동작을 더 세밀하게 제어할 수 있도록 boundary truncation 검사와 모드(off / only_flag / on)를 추가했습니다.
그룹 기반 VitPose 검증 및 파이프라인 옵션 추가: 그룹 단위 VitPose 처리와 설정 가능한 실행 옵션을 검증 파이프라인에 확장 적용했습니다.
개선 사항
관심영역 요청 처리 단순화: 기존 legacy interest request schema를 제거하고, 새로운 인터페이스 기준으로 요청 처리 구조를 정리했습니다.
버그 수정
응답 파싱 형식 불일치로 VitPose 검증이 실행되지 않던 문제 수정: RT-DETR v2 핸들러에서 응답 형식 불일치로 인해 VitPose 검증이 건너뛰어질 수 있던 문제를 해결했습니다.
기타 변경 사항
런타임 베이스 이미지를 Ubuntu 24.04 기반 CUDA 12.8로 업그레이드: 컨테이너 런타임 의존성을 최신 NVIDIA CUDA 베이스 이미지로 업데이트했습니다.
v1.3.1 (March 11, 2026)
호환성: 이 버전은 EVA App v2.3.0 ~ 2.6.1 버전이 필요합니다.
성능 개선
벤치마크 결과 기반 MODEL_RESOURCE_PROFILES 업데이트: 카메라 부하 테스트 결과를 반영하여 카메라-워커 매핑, 워커당 GPU 메모리, max_effective_cameras 제약 조건을 설정.
동적 워커 스케일링 설정 업데이트: 운영 환경에서의 리소스 할당 정확도를 높이기 위해 스케일링 파라미터 조정.
MMGDino & LLMDet Vision Caching 적용: 중복 연산을 줄여 추론 처리량을 개선하기 위해 비전 캐싱 활성화.
버그 수정
get_gpu_info()에서 CUDA_VISIBLE_DEVICES 기준으로 GPU 필터링: 멀티 GPU 호스트에서 CUDA_VISIBLE_DEVICES 환경 변수를 반영하지 않아 GPU 수가 잘못 감지되던 문제 수정.
number_of_netty_threads 및 worker_retry_timeout_sec 설정: 안정적인 워커 생명주기 관리를 위해 TorchServe 내부 스레딩 및 재시도 파라미터 설정.
v1.3.0 (February 12, 2026)
Compatibility: 이 버전은 EVA App v2.3.0 ~ 2.6.1 버전이 필요합니다.
Features
MM-Grounding-DINO (Swin-B) 모델 추가: 향상된 zero-shot 객체 감지 기능을 위해 Swin-B 백본을 사용하는 MM-Grounding DINO 모델을 도입했습니다.
앱 카메라 관리 및 TorchServe 관리 래핑 API 구현: 카메라 연결 및 TorchServe 모델 라이프사이클을 관리하기 위한 새로운 API 인터페이스를 추가하여 비전 파이프라인 구성 요소에 대한 중앙 집중식 제어를 제공합니다.
배치 카메라 API 추가: 여러 카메라 스트림에 대한 배치 처리 기능을 구현하여 동시 카메라 입력을 효율적으로 처리할 수 있습니다.
모델 워커 관리 API 추가: 모델별 현재 워커 개수를 확인하는 GET models/workers/current 엔드포인트와 수동 워커 스케일링을 위한 PUT models/{model_name}/workers 엔드포인트를 구현하여 모델 서빙 리소스에 대한 세밀한 제어가 가능합니다.
LLMDet을 Swin-B 백본으로 업데이트: 감지 정확도 향상을 위해 LLMDet 모델을 이전 백본에서 Swin-B로 업그레이드했습니다.
LLMDet 텍스트 접두사 및 크롭 영역 수정: 텍스트 프롬프트 접두사 형식을 수정하고 적절한 감지 범위를 위해 크롭 영역 경계 문제(ymin: 1 → ymin: 0)를 해결했습니다.
RT-DETRv2 컴파일 최적화: 더 나은 추론 성능을 위해 디바이스 타입을 명시적으로 지정하고 RT-DETRv2 컴파일 모드를 reduce-overhead로 업데이트했습니다.
모델 컴파일 안정성 향상: torch.compile 기능을 검증하기 위한 더미 forward pass를 추가했습니다. 컴파일이 실패하면 자동으로 원본 모델로 폴백하며, 안정성 향상을 위해 컴파일 모드를 기본값으로 설정했습니다.
모델 워밍업 스크립트 구현: 초기 추론 지연 시간을 최적화하고 모델이 프로덕션 워크로드에 준비되도록 전용 워밍업 기능을 추가했습니다.
교차 비율 임계값 조정: 더 정밀한 감지 중첩 필터링을 위해 교차 비율을 0.5에서 0.95로 증가시켰습니다.
Deployment
환경 변수를 사용한 포트 설정 중앙화: 다양한 환경에서 향상된 배포 유연성과 설정 관리를 위해 환경 기반 포트 관리를 구현했습니다.
리소스 관리 개선: 더 나은 시스템 안정성과 성능을 위해 리소스 할당 및 관리를 리팩토링했습니다.
v1.2.0 (December 24, 2025)
Compatibility: 이 버전은 EVA App v2.3.0 ~ 2.6.1 버전이 필요합니다.
Features