我正在嘗試使用敏捷包解析來自各個頁面的某些信息位。我有點擔心,如果有這種情況,可以隨時讓我知道,那麼使用它可能會使我需要的東西過度消耗。無論如何,我試圖從雜色的傻瓜分析一個頁面,以獲取基於股票的公司名稱。我將解析幾個頁面以類似的方式獲取股票信息。HTML敏捷包問題(試圖從源頭解析字符串)
,我想分析看起來像HTML:
<h1 class="subHead">
Microsoft Corp <span>(NASDAQ:MSFT)</span>
</h1>
另外,我想分析的頁面是:http://caps.fool.com/Ticker/MSFT.aspx
所以,我想我的問題是怎麼做的,我只是得到了微軟公司從HTML,我應該甚至使用敏捷包來做這樣的事情?
編輯:當前代碼
public String getStockName(String ticker)
{
String text ="";
HtmlAgilityPack.HtmlWeb web = new HtmlAgilityPack.HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = web.Load("http://caps.fool.com/Ticker/" + ticker + ".aspx");
var node = doc.DocumentNode.SelectSingleNode("/h1[@class='subHead']");
text = node.FirstChild.InnerText.Trim();
return text;
}
我發現HTML Agility Pack非常適合這種情況 - 即沒有提供數據源的地方,但是由於某些原因,您仍然想要解析第三方數據。我做了一些和你過去的工作非常相似的東西。下一步是解析出價格,每日變化等。:) – 2011-04-10 21:23:53
@ C.McAtackney謝謝!是的,這只是一個開始,但我認爲一旦我的腳溼了,就不會那麼粗糙了。我很感激你讓我知道我走在正確的軌道上。 – PFranchise 2011-04-10 21:28:11