Công cụ xử lý đánh dấu có cấu trúc¶
Python hỗ trợ nhiều mô-đun khác nhau để hoạt động với nhiều dạng đánh dấu dữ liệu có cấu trúc khác nhau. Điều này bao gồm các mô-đun để hoạt động với Ngôn ngữ đánh dấu tổng quát tiêu chuẩn (SGML) và Ngôn ngữ đánh dấu siêu văn bản (HTML) và một số giao diện để làm việc với Ngôn ngữ đánh dấu mở rộng (XML).
html--- Hỗ trợ ngôn ngữ đánh dấu siêu văn bảnhtml.parser--- Trình phân tích cú pháp HTML và XHTML đơn giảnhtml.entities--- Định nghĩa về các thực thể chung của HTML- Mô-đun xử lý XML
xml.etree.ElementTree--- ElementTree XML APIxml.dom--- Mô hình đối tượng tài liệu APIxml.dom.minidom--- Triển khai DOM tối thiểuxml.dom.pulldom--- Hỗ trợ xây dựng cây DOM một phầnxml.sax--- Hỗ trợ trình phân tích cú pháp SAX2xml.sax.handler--- Các lớp cơ sở cho trình xử lý SAXxml.sax.saxutils--- SAX Tiện íchxml.sax.xmlreader--- Giao diện cho trình phân tích cú pháp XMLxml.parsers.expat--- Phân tích cú pháp XML nhanh bằng Expat