我是新手powershell用戶請耐心等待。我試圖解析HTML表在PowerShell中的標籤之間的字符串, 下面是HTMLPowershell提取本地html標記
<head>
<title>HTML TABLE</title>
</head><body>
<table>
<colgroup><col/><col/></colgroup>
<tr><th>TestcaseName</th><th>Status</th></tr>
<tr><td>abcd </td><td>First </td></tr>
<tr><td>xyz </td><td>Second </td></tr>
<tr><td>pqr </td><td>Third </td></tr>
</table>
</body>
</html>
這是我所試過的代碼
$arr = @()
$path = "C:\test.html"
$pattern = '(?i)<tr[^>]*><td[^>]*>(.*)</td><td>'
Get-Content $path | Foreach {if ([Regex]::IsMatch($_, $pattern)) {
$arr += [Regex]::Match($_, $pattern)
}
}
$arr | Foreach {$_.Value}
預計產量
abcd
xyz
pqr
但結果是
<tr><td>abcd </td><td>
<tr><td>xyz </td><td>
<tr><td>pqr </td><td>
任何人都可以提到爲什麼標籤也是作爲輸出獲取以及如何避免這種情況。此外,我想追加文本到每個數組元素,例如:<a href="\\192.116.1.2\cluster_110">abcd, <a href="\\192.116.1.3\cluster_110">xyz
等,請提及相同,因爲它涉及特殊字符。