什么是標記語言
編輯標記語言是指一種文本編碼系統,由插入文本文件中的一組符號組成,以控制其結構、格式或其各部分之間的關系。標記經常被用來控制文件的顯示或豐富其內容以促進自動處理。標記語言是一套規則,規定哪些標記信息可以包含在文檔中,以及如何與文檔內容相結合,以方便人類和計算機程序使用。這個想法和術語是從紙質手稿的標記(即編輯的修改指示)演變而來的,傳統上是用紅筆或藍筆寫在作者的手稿上。較早的標記語言,通常側重于排版和演示,包括troff、TeX和LaTeX。Scribe和大多數現代的標記語言,例如XML,都標識了文檔的組成部分(例如標題、段落和表格),并期望使用樣式表等技術來進行格式化或其他處理。一些標記語言,如廣泛使用的HTML,有預先定義的表現語義,意味著它們的規范規定了如何在特定媒體上表現結構化數據的某些方面。像DocBook、OpeneBook、JATS和其他許多語言一樣,HTML是基于標記元語言SGML和XML的。也就是說,SGML和XML允許設計者指定特定的模式,這些模式決定了哪些元素、屬性和其他特征是允許的,以及在什么地方。大多數標記語言的一個極其重要的特點是,它們允許將標記與文本和圖片等文件內容混合在一起。例如,如果一個句子中的幾個詞需要強調,或被確定為專有名詞、定義術語或其他特殊項目,標記可以被插入句子的字符之間。這在結構上與傳統的數據庫有很大的不同,在傳統的數據庫中,根據定義,不可能有數據在一條記錄中但不在任何字段中。此外,人類可讀文本的標記必須維持秩序:把一本書的每一段都變成一個段落記錄是不夠的,因為這些記錄并不維持秩序。
標記語言的詞源
編輯標記(markup)這個名詞來自于傳統的出版實踐,稱為標記手稿,即在紙張或印刷手稿的空白處和文本中,以傳統的符號印刷廠指示的形式添加手寫的注釋。幾個世紀以來,這項工作主要是由熟練的排字員完成的,他們被稱為標記員或D標記員,他們在文本上做標記,指出每個部分應該使用什么字體、風格和尺寸,然后將手稿交給其他人用手工或機器進行排版。標記也通常由編輯、校對、出版商和圖形設計師應用,實際上也由文件作者應用,他們都可能標記其他東西,如更正、修改等。
呈現性標記
編輯傳統的文字處理系統所使用的那種標記:二進制代碼嵌入到文檔文本中,產生所見即所得的效果。這種標記通常對人類用戶,甚至作者和編輯都是隱藏的。正確地說,這種系統在下面使用程序性和/或描述性標記,但將其轉換為呈現給用戶的類型的幾何排列。
程序性標記
編輯標記被嵌入到文本中,為程序處理文本提供指令。知名的例子包括troff、TeX和Markdown。假設軟件從頭到尾按順序處理文本,按照遇到的指令進行處理。
流行的程序性標記系統通常包括編程結構,特別是宏,允許通過一個簡單的名字(也許還有幾個參數)來調用復雜的指令集。
描述性標記
編輯標記是專門用來標記文檔中的部分內容的,而不是標記它們應該如何被處理。提供許多此類標簽的知名系統包括LaTeX、HTML和XML。其目的是將文檔的結構與任何特定的處理或演繹方式脫鉤。這樣的標記通常被描述為語義。
內容由匿名用戶提供,本內容不代表www.gelinmeiz.com立場,內容投訴舉報請聯系www.gelinmeiz.com客服。如若轉載,請注明出處:http://www.gelinmeiz.com/163972/