Python XPath 데이터 스크래핑 실전 예제
XPath는 XML 및 HTML 문서에서 데이터를 효율적으로 추출하기 위한 강력한 도구입니다. lxml 라이브러리와 함께 사용하면 웹 스크래핑 작업을 간소화할 수 있습니다. 아래에서 기본 문법과 다양한 활용법을 예제를 통해 알아봅니다.
XPath 기본 문법
샘플 HTML 문서를 준비합니다:
from lxml import etree
html = """
<html>
<head lang="en">
<title> ...
5월 26일 19:06에 게시됨