2009-01-08 56 views
2

HTML精簡給出了這樣的作爲由於某種原因輸出:錯誤的類型(未UTF-8)的刪除重複的XML頭

<?xml version="1.0" encoding="utf-16"?> 
<?xml version="1.0" encoding="utf-16"?> 
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" 
    "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> 

<html xmlns="http://www.w3.org/1999/xhtml"> 
<head> 
<meta name="generator" content= 
"HTML Tidy for Linux/x86 (vers 11 February 2007), see www.w3.org" /> 
<meta name="vs_targetSchema" content="http://schemas.microsoft.com/intellisense/ie5" /> 

...rest of document 

所以有2 XML頭文件和。 有沒有辦法刪除第二個標題,將其更改爲UTF-8,並使用XSL刪除DOCTYPE?

回答

4

我認爲最好是解決原來的問題。你使用HTML Tidy庫嗎?

嘗試將output-encoding設置爲utf8和add-xml-decl爲false。可以通過將doctype屬性設置爲省略來禁止DOCTYPE節點。

2

是的。創建一個匹配你想接受的第一個子元素的模板,然後讓它輸出該元素的內容。

+0

...因爲我在我的xml文件中有一個DTD導致錯誤... – eddy147 2009-01-08 12:31:18