lingbot-depth-pretrain-vitl-14 컨테이너 아키텍처: PyTorch 2.6 기반 깊이 추정 파이프라인

1. 단일 이미지에서 3D 공간으로 일상적인 실내 사진 하나를 컴퓨터에 입력하면 화면 속 소파와 테이블, 창문을 인식하는 것을 넘어 각 객체까지의 실제 거리를 알려준다면? 소파는 약 2m, 테이블은 3m, 창문은 8m 정도 떨어져 있다고. 이것이 깊이 추정(depth estimation) 모델이 수행하는 작업이다. lingbot-depth-pretrain-vitl-14 컨테이너는 DINOv2 기반의 대규모 ...

6월 19일 21:00에 게시됨