我有做以下如何將Net :: HTTP響應轉換爲Ruby 1.9.1中的某種編碼?
- 檢索一個HTML頁面西納特拉應用(http://analyzethis.espace-technologies.com)(通過網/ HTTP)
- 從response.body
- 創建一個引入nokogiri文檔中提取一些信息,併發送它回到了迴應。該反應應該是UTF-8編碼
我到了這個問題,而試圖讀取使用windows-1256編碼方式,如www.filfan.com或www.masrawy.com網站。
問題是編碼轉換的結果不正確,雖然沒有發生錯誤。
淨/ HTTP response.body.encoding給ASCII-8BIT不能轉換爲UTF-8
如果我做引入nokogiri :: HTML(response.body),並使用CSS選擇器來獲得某些來自頁面的內容 - 比如標題標籤的內容 - 例如,我得到一個字符串,當我調用string.encoding時,返回WINDOWS-1256。我使用string.encode(「utf-8」)並使用它發送響應,但是響應又不正確。
有關我的方法中出現問題的任何建議或想法?
它很棒! – 2016-10-28 13:32:02