我已閱讀有關此主題的大多數答案都指向System.Windows.Forms.WebBrowser類或來自Microsoft HTML Object Library程序集的COM接口mshtml.HTMLDocument。如何使用.NET的WebBrowser或mshtml.HTMLDocument動態生成HTML代碼?
WebBrowser類沒有帶領我到任何地方。以下代碼未能檢索到我的網絡瀏覽器呈現的HTML代碼:
[STAThread]
public static void Main()
{
WebBrowser wb = new WebBrowser();
wb.Navigate("https://www.google.com/#q=where+am+i");
wb.DocumentCompleted += delegate(object sender, WebBrowserDocumentCompletedEventArgs e)
{
mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)wb.Document.DomDocument;
foreach (IHTMLElement element in doc.all)
{
System.Diagnostics.Debug.WriteLine(element.outerHTML);
}
};
Form f = new Form();
f.Controls.Add(wb);
Application.Run(f);
}
以上只是一個示例。我並不是真的有興趣找到解決我所在城鎮名稱的解決方法。我只需要了解如何以編程方式檢索那種動態生成的數據。
(調用新的System.Net.WebClient.DownloadString(「https://www.google.com/#q=where+am+i」),將結果文本保存到某處,搜索當前所在城鎮的名稱,並讓我知道您是否能夠找到它)
但是,當我從我的Web瀏覽器(即Firefox或Firefox)訪問「https://www.google.com/#q=where+am+i」時,我看到我的城鎮的名稱寫在網頁上。在Firefox中,如果我右鍵單擊城鎮的名稱並選擇「檢查元素(Q)」,我清楚地看到用HTML代碼編寫的城鎮名稱,這看起來與WebClient返回的原始HTML完全不同。
後,我厭倦了打System.Net.WebBrowser,我決定給mshtml.HTMLDocument了一槍,正好與同無用原始的HTML結束:
public static void Main()
{
mshtml.IHTMLDocument2 doc = (mshtml.IHTMLDocument2)new mshtml.HTMLDocument();
doc.write(new System.Net.WebClient().DownloadString("https://www.google.com/#q=where+am+i"));
foreach (IHTMLElement e in doc.all)
{
System.Diagnostics.Debug.WriteLine(e.outerHTML);
}
}
我想必須有一個優雅的方式來獲取這種信息。現在我所能想到的只是將WebBrowser控件添加到表單中,讓它導航到正在討論的URL,發送密鑰「CLRL,A」,並將發生在頁面上的任何事情複製到剪貼板並嘗試解析它。雖然這是可怕的解決方案。
我不得不添加到CancellationTokenSource用於我的目的,工作的時間間隔,但除此之外,該解決方案很好工作!我嘗試了很多其他的「解決方案」,但這是唯一真正解決我的問題的方案。 – majestzim