웹 이미지 데이터 정제 및 파일명 처리 기법
(MidJourney 데이터 분리) MidJourney 생성된 이미지 파일들을 별도 폴더로 이동
(일괄 이름 변경) 필요 없는 웹 콘텐츠 관련 파일은 일괄적으로 이름을 수정하여 구분
(크롤링된 제목 정제) 외부에서 수집한 파일명에 포함된 특수문자와 숫자를 제거하되, 쉼표, 마침표, 괄호 및 괄호 내 숫자는 유지
import os
import re
def sanitize_filename(filename):
...
6월 27일 06:10에 게시됨