XML
編輯XML(Extensible Markup Language,可擴展標記語言),簡稱XML,是一種以人機可讀的文本文件格式表示層次結構數據的標記語言。
XML 還用于計算機系統之間獨立于平臺和實現的數據交換,特別是在 Internet 上,并于 1998 年 2 月 10 日由萬維網聯盟 (W3C) 發布。 當前版本是 2008 年 11 月 26 日發布的第五版。XML 是一種元語言,在此基礎上通過結構和內容相關的限制定義特定于應用程序的語言。 這些限制由文檔類型定義 (DTD) 或 XML 模式表示。 XML 語言的示例有:RSS、MathML、GraphML、XHTML、XAML、可縮放矢量圖形 (SVG)、GPX,還有 XML 模式本身。
XML 文檔的標準字符編碼是 UTF-8。 處理 XML 的系統必須能夠使用 UTF-8 和 UTF-16 編碼。 使用 UTF-8 或 UTF-16 的 XML 文檔可以在任何支持這些編碼的文本編輯器中查看和編輯。
如果 XML 文檔要包含二進制數據,則必須將此數據重新編碼為文本。 這可以例如 B. 可以使用base64編碼。
技術術語
編輯項目
XML 文檔最重要的結構單元是元素。 元素可以包含文本以及其他元素作為內容。 元素構成 XML 文檔結構樹的節點。 在沒有文檔類型定義 (DTD) 的情況下,可以在 XML 文檔中自由選擇 XML 元素的名稱。 在具有 DTD 的 XML 文檔中,元素的名稱必須在 DTD 中聲明,并且該元素必須根據 DTD 位于結構樹中的合法位置。 除其他事項外,DTD 定義每個元素的可能內容。 元素是 XML 文檔中信息的載體。
正式
如果一個 XML 文檔符合所有 XML 規則,則它被稱為“格式良好”。 此處提及以下內容作為示例:
- 文檔只有一個根元素。 最外層的元素稱為根元素,例如 ; 到 XHTML。
- 所有包含內容的元素都有開始和結束標記(例如,<entry>entry 1</entry>)。 沒有內容的元素可以用空格標記標記(例如 <entry />)。
- 開始標簽和結束標簽成對嵌套。 這意味著所有元素必須在相應父元素的結束限定符或兄弟元素的開始限定符出現之前關閉。
- 一個元素不能有多個同名的屬性。
- 屬性值必須用引號引起來(“...”或'...')。
- 開始和結束標簽區分大小寫(例如,<entry></entry> 無效)。
有效性
如果 XML 將用于數據交換,那么使用語法定義格式(例如文檔類型定義或 XML 模式)是有利的。 該標準將 XML 文檔定義為有效,前提是它的格式正確、包含對語法的引用并符合語法描述的格式。
解析器
讀出、解釋并在必要時檢查 XML 數據有效性的程序或程序部分稱為 XML 解析器。 如果解析器檢查有效性,那么它就是一個驗證解析器。
XML 文檔的結構
編輯物理結構
- 文檔實體包含主文檔。
- 其他可能的實體在上面
- 實體引用(&name; 用于文檔或 %name; 用于文檔類型定義)嵌入的字符串,也可能是整個文件,以及對 Zei 的引用實體以包括由其編號引用的單個字符。
- XML 聲明用于指定 XML 版本、字符編碼以及是否可以在沒有 DTD 的情況下進行處理。
- DTD 用于指定實體和允許的邏輯結構。 可以在 XML 聲明中取消選擇 DTD 的使用。
邏輯結構
邏輯結構對應樹結構,因此是分層組織的,樹節點有:
- 物理標記使用的元素
- 一對匹配的開始標簽; 和結束標記 </tagname> 或
- 一個空標簽的 ; 可以做到,
- 屬性作為元素的附加屬性寫入語法屬性名稱=屬性值中的開始標記或空白標記,
- 處理指令 (處理說明),
- 評論<!--Comment-Text-->,和
- 以普通字符數據或 CDATA 部分形式呈現的文本 ; 可能發生。
一個 XML 文檔必須只包含一個xxx元素。 附加元素和文本可以嵌套在該文檔元素下方。
DTD
編輯文檔類型定義 (DTD) 描述文檔的結構和語法。 它是 XML 的系統組件,默認激活。
如果文檔是參考外部文檔類型定義或集成文檔類型定義創建的,則解析器在打開(讀取)文檔時已經檢查了該文檔。 基于文檔類型定義的文檔始終是有效文檔。 文檔內容與文檔類型定義規則的一致是最重要的。 技術可讀性,即非有效文件的閱讀,是次要的。 這適用于全文文檔(敘述性文檔),是主要使用目的。
沒有 DTD 的文檔更適合任何數據交換。 解析器僅根據格式良好的規則檢查這些文檔。 技術可讀性是這里的重中之重。 使用下游流程檢查和讀出實際信息。
XML文檔的分類
編輯XML 文檔可以根據其預期用途和結構級別分為以文檔為中心和以數據為中心的文檔。 但是,這些類型的文檔之間的界限是不固定的。 混合形式可以描述為半結構化。
- 以文檔為中心:文檔基于文本文檔,即使沒有額外的元信息,人類讀者也可以理解其中的大部分內容。 XML元素主要用于文檔中段落的語義標記,文檔只是弱結構化的。 結構薄弱,機加工困難。
- 以數據為中心:文檔主要用于機器處理。 它遵循描述數據模型實體并定義實體如何相互關聯以及實體具有哪些屬性的模式。 因此,該文檔高度結構化,不太適合直接供人使用。
- 半結構化:半結構化文檔是一種混合體,比以文檔為中心的文檔結構化程度高,但比以數據為中心的文檔弱。
元素具有元素內容或文本內容是典型的以數據為中心的 XML 文檔。 所謂的混合內容,其中元素包含文本和子元素,是其他 XML 文檔的典型特征。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/361619/