下面是一份在 HTML 4 Strict 和 XHTML 1.0 Strict 下必須遵守的標簽嵌套規則,比如你不能在
<a>
裡面再嵌入一個
<a>
這樣的約定。
說明:
- 為了方便讀者閱讀,本文中的標簽使用了大寫(根據 XHTML 的規則,元素名必須小寫,比如 而不應是 )
- 小寫的單詞表明一組或一系列 HTML 標簽
- 每一項條目(標簽)後都跟隨一組標簽列表,如果沒有這個列表,那麼表明該條目(標簽)內部不允許包含任何標簽。這意味著該條目內部只能包含純文本內容(#PCDATA,見下文)。如果注明 (empty),這意味著該條目內部不允許包含任何形式的內容。對於 flow,inline,block,OBJECT 和 BODY,其內部允許包含的內容在文中會單獨給出。
- #PCDATA 的意思是“parsed character data”,即純文本內容(不包括任何 HTML 標簽,但是轉義內容可以存在,比如 ä 和 ä)
- CDATA 的意思是“character data”,這意味著不包括轉義內容的純文本內容,詳細內容可以參考CDATA Confusion
- excluding ... 意即不得直接或者間接的包含所列的元素
注1. 以上內容基於 [HTML 4.01 Specification] 的 Strict DTD。JunChen 翻譯自 Allowed nesting of elements in HTML 4 Strict (and XHTML 1.0 Strict)
注2. 對於 XHTML 1.0,基本上一致,不同點如下:
- 對於
<script>
和 <style>
的內容,在 HTML 4 裡是 CDATA
而在 XHTML 裡是 #PCDATA
- 在 XHTML 中,
<table>
標簽後可以緊跟一個 <tr>
,而在 HTML 4.01 裡,不允許這樣,不過 <tbody>
標簽又是可以省略的。意思就是說,如果代碼中的 <table>
後緊跟 <tr>
,對於 HTML 4.01,會隱性的生成一個 <tbody>
標簽,而在 XHTML 裡面就沒有。這會影響到樣式表使用 tbody
作為選擇器。