PyTorch 특정 레이어 시각화 방법
이미지를 로드하고 전처리하는 코드입니다.
import cv2
import matplotlib.pyplot as plt
%matplotlib inline
# 자신의 이미지 파일 경로로 변경 가능합니다
img_path = 'images/udacity_sdc.png'
# 컬러 이미지 로드
bgr_img = cv2.imread(img_path)
# 그레이스케일로 변환
gray_img = cv2.cvtColor(bgr_img, cv2.COLOR_BGR2GRAY)
# 값을 [0,1] 범위로 정규화
gray_im ...
5월 21일 02:42에 게시됨
PyTorch DDP 및 torchrun을 활용한 분산 학습 기초 사용법
분산 학습의 핵심 개념
분산 학습은 여러 GPU를 활용해 모델 학습 속도를 향상시키는 기술입니다. 여기서 중요한 개념은 다음과 같습니다:
병렬 처리 (Parallel): 여러 장치에서 동시에 작업 수행, 프로세스 수에 따라 단일 또는 다중 프로세스 구조 가능
분산 환경 (Distributed): 각 GPU마다 별도의 프로세스가 실행되며, 통신을 통해 상태를 동기화하는 방식
본 ...
5월 20일 19:19에 게시됨
PyTorch 텐서 차원과 브로드캐스팅 완벽 이해
텐서의 차원 개념과 연산 후 차원 변화를 정확히 파악하는 것은 복잡한 신경망 구조를 이해하는 데 핵심입니다. 이 글에서는 PyTorch 텐서 생성과 브로드캐스팅 메커니을 심도 있게 다룹니다.
무작위 텐서 생성
딥러닝에서는 가중치 초기화나 모듈 통과 후 출력 형태 확인 등을 위해 무작위 텐서를 자주 생성합니다. 실제 이미지를 불러올 필요 없이 원하는 형태의 텐서 ...
5월 20일 15:26에 게시됨
EasyOCR 기술 심층 분석: 사용하기 쉬운 광학 문자 인식 도구
개요
EasyOCR는 JaidedAI가 개발한 오픈소스 OCR(Optical Character Recognition, 광학 문자 인식) 라이브러리로, PyTorch 딥러닝 프레임워크를 기반으로 구현되었습니다. 이 프로젝트는 GitHub에서 29,000개 이상의 스타를 받았으며, 112명의 기여자와 16,900개 이상의 프로젝트에서 채택되어 커뮤니티에서 널리 인정받고 있음을 보여줍니다.
EasyOCR의 가장 큰 특징은 바 ...
5월 20일 11:26에 게시됨