BeautifulSoup를 활용한 HTML 구문 분석 및 데이터 추출
BeautifulSoup(약칭 bs4)는 HTML 및 XML과 같은 초과 마크업 텍스트를 처리하고, 원하는 태그 내부의 텍스트를 추출하는 데 유용한 파이썬 라이브러리입니다. 주로 웹 스크래핑 작업에서 널리 사용됩니다.
라이브러리 설치
bs4와 관련된 의존성 패키지를 설치합니다.
pip install bs4 -i https://pypi.tuna.tsinghua.edu.cn/simple/
pip install lxml
lxml은 파이썬에서 ...
6월 17일 20:26에 게시됨