我在C#中遇到了WebRequest
問題。這是一個谷歌頁面。閱讀網站的編碼問題,三種不同的編碼
頭狀態
text/html; charset=ISO-8859-1
網站狀態
<meta http-equiv=content-type content="text/html; charset=utf-8">
最後,我只能得到在調試器中預期的結果,以及正則表達式,當我使用Encoding.Default
默認爲System.Text.SBCSCodePageEncoding
現在我該怎麼辦?你有任何提示,如何發生這種情況,或者我可以如何解決這個問題?
頁面的實際編碼似乎是UTF-8。至少FF在Windows中以UTF-8,而不是正確顯示它,而在拉丁文1中以而非正確顯示。
網址爲this
的問題是€-sign以及所有德國日爾曼
在此先感謝您對這個問題的幫助,這讓我非常瘋狂!
更新:當我通過輸出
// create a writer and open the file
TextWriter tw = new StreamWriter("test.txt");
// write a line of text to the file
tw.WriteLine(html);
// close the stream
tw.Close();
字符串它工作一切正常。
所以它似乎問題是,調試器不顯示正確的編碼和正則表達式也。
如何告訴C#將RegEx作爲UTF-8處理?
你有沒有到使用上的相關編碼類`GetBytes會()`方法,您的字符串從一種編碼轉換爲另一種? – RobV 2011-02-01 13:09:28