2015-02-07 58 views
0

請告訴我從http://www.azlyrics.com/lyrics/paparoach/coffeethoughts.html獲取歌詞有什麼問題。我希望只有歌詞會被提取。 預先感謝您網頁報廢 - WP8 - HTMLAgilityPack

protected async override void OnNavigatedTo(NavigationEventArgs e) 
    { 
     base.OnNavigatedTo(e); 
     string htmlPage = ""; 
     using (var client = new HttpClient()) 
     { 
      htmlPage = await client.GetStringAsync("http://www.azlyrics.com/lyrics/paparoach/coffeethoughts.html/"); 
     } 

     HtmlDocument htmlDocument = new HtmlDocument(); 
     htmlDocument.LoadHtml(htmlPage); 

     List<Lyrics> lyrics = new List<Lyrics>(); 

     foreach (var div in htmlDocument.DocumentNode.SelectNodes("//div[@style='margin-left:10px;margin-right:10px']")) 
     { 
      Lyrics newMovie = new Lyrics(); 
      newMovie.Summary= div.SelectSingleNode("br\\").InnerText.Trim(); 
      //newMovie.Summary = div.SelectSingleNode(".//div[@id='lyrics']").InnerText.Trim(); 
      //newMovie.Title = div.SelectSingleNode(".//div[@class='title']").InnerText.Trim(); 
      lyrics.Add(newMovie); 
     } 

     lstMovies.ItemsSource = lyrics; 
    } 
} 

}

回答

0

您的查詢是錯誤的。

//div[@style='margin-left:10px;margin-right:10px'] 

應該

//div[@id='main']/div[3] 

我寫了一篇文章關於報廢,如果你想:Get content from a webpage or 「How to Scrape the Sky」


順便提一下,azlyrics.com由musicxmatch提供技術支持。也許你應該檢查他們的API而不是報廢? 安全飲用水從源頭開始。

+0

您的解決方案不起作用 – 2015-02-09 16:44:40

+0

您的錯誤是什麼? – aloisdg 2015-02-11 13:37:12