結構化標記處理工具¶
Python 支援多種模組來處理各種形式的結構化資料標記。這包括用於處理標準通用標記語言 (SGML, Standard Generalized Markup Language) 和超文本標記語言 (HTML, Hypertext Markup Language) 的模組,以及用於處理可擴展標記語言 (XML, Extensible Markup Language) 的幾個介面。
html
--- 超文本標記語言 (HTML) 支援html.parser
--- 簡單的 HTML 和 XHTML 剖析器html.entities
--- HTML 一般實體的定義- XML 處理模組
xml.etree.cElementTree
--- ElementTree XML APIxml.dom
--- Document 物件模型 APIxml.dom.minidom
--- 最小的 DOM 實作xml.dom.pulldom
--- 支援建置部分 DOM 樹xml.sax
--- SAX2 剖析器支援xml.sax.handler
--- SAX 處理函式的基本類別xml.sax.saxutils
--- SAX 工具程式xml.sax.xmlreader
--- XML 剖析器的介面xml.parsers.expat
--- 使用 Expat 進行快速 XML 剖析