2015-04-17 48 views
2

通常XML文檔可以從兩個主要方面來考慮:內容和結構。我想知道從這些文檔的結構中可以推斷出什麼類型的信息?可以從XML文檔的結構推斷出什麼?

目前我知道XML schema/DTD可以通過分析結構來重建;這是保留XML結構的主要目標嗎?如果這是真的,爲什麼架構如此重要?

+0

該模式對驗證非常重要,即檢查XML是否處於預期結構中。至於你的其餘問題:這可能太寬泛了,無法在這裏回答。 – helb

+0

@helb,謝謝。更具體一點,是否有可能從架構/ DTD隱私泄露? –

+0

@ j.fra什麼樣的隱私泄露? – biziclop

回答

1

一般是XML文件可以從兩個主要方面來考慮: 內容和結構

這通常不是一個富有成效的二分法。也許你正在考慮內容和表示之間的分離,這是一種有效的區別。

目前我知道,XML模式/ DTD可以通過 分析結構

這是事實,一個模式可以通過查看XML實例文檔的結構被寫入重建。對於僅給定一個XML實例文檔的XML實例文檔類別,在正確的抽象級別上編寫模式並不是真的。

這是保留XML結構的主要目標嗎?如果這是真的, 爲什麼架構如此重要?

已知結構有利於內容的通信。作爲表達對結構的協議的載體,模式是重要的。

前往您的標題問題,那麼:

什麼可以從XML文檔的結構來推斷?

大部分可以推斷的是,它是在模式,文檔或在XML上運行的人員或程序的行爲中分別傳達的。

有,但是,出現由於XML本身的性質某種內在關係:

  • 遏制和層次,可以通過 元素的嵌套推斷。
  • 關聯可以通過元素的屬性或定位來推斷。
  • 含義可以通過命名元素和屬性來推斷。
+0

'可以通過元素的屬性或定位來推斷關聯。「特別是,可以通過查看屬性是屬性還是元素來猜測元素。 – biziclop

+0

@kjhughes,謝謝你的回答,爲了保護,有什麼方法可以保護,加密,架構?如信息隱藏的文件內容。 –

+0

@biziclop:啊,是的,在結構中也可能有一個arity信號。謝謝。 – kjhughes