我想提取html頁面中<head>
標記元素之間的所有內容。包括鏈接標籤和腳本標籤。使用XSLT提取HTML元素
假設下面的源代碼是一個片段,它將成爲完整的html文檔的一部分。
來源:
...
<head>
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<script type="text/javascript" src="main.js"></script>
<script type="text/javascript" src="second.js"></script>
</head>
...
XSLT:
<xsl:output method="xml" encoding="utf-8" indent="no"/>
<xsl:template match="/">
<xsl:copy-of select="link"/>
</xsl:template>
這工作正常,如果只有一個標籤,我試圖讓。有沒有一種方法可以處理所有事情,只有「頭」標籤之間的所有內容。
我預計會是輸出:
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<link rel="stylesheet" href="style.css"
type="text/css" media="handheld" />
<script type="text/javascript" src="main.js"></script>
<script type="text/javascript" src="second.js"></script>
您能否提供一個更完整的源文檔示例,以及您期望的輸出示例? – 2013-05-07 17:38:30
通常,只能在符合XML的數據(如XHTML)上使用XSL。如果你的輸入不是XHTML,你可能會在某個時候得到解析異常。 – 2013-05-07 22:53:53