html --- Hỗ trợ ngôn ngữ đánh dấu siêu văn bản¶
Source code: Lib/html/__init__.py
Mô-đun này xác định các tiện ích để thao tác HTML.
- html.escape(s, quote=True)¶
Chuyển đổi các ký tự
&,<và>trong chuỗi s thành chuỗi HTML-safe. Sử dụng tính năng này nếu bạn cần hiển thị văn bản có thể chứa các ký tự như vậy trong HTML. Nếu cờ tùy chọn quote là đúng (mặc định), các ký tự (") và (') cũng được dịch; điều này giúp đưa vào giá trị thuộc tính HTML được phân tách bằng dấu ngoặc kép, như trong<a href="...">. Nếu quote được đặt thành false thì các ký tự (") và (') sẽ không được dịch.Added in version 3.2.
- html.unescape(s)¶
Chuyển đổi tất cả các tham chiếu ký tự được đặt tên và số (ví dụ:
>,>,>) trong chuỗi s thành các ký tự Unicode tương ứng. Hàm này sử dụng các quy tắc được xác định bởi tiêu chuẩn HTML 5 cho cả tham chiếu ký tự hợp lệ và không hợp lệ cũng nhưlist of HTML 5 named character references.Added in version 3.4.
Các mô-đun con trong gói html là:
html.parser-- trình phân tích cú pháp HTML/XHTML với chế độ phân tích cú pháp nhẹ nhànghtml.entities-- định nghĩa thực thể HTML