的nutch履帶爬行let's
作爲Let’s
ÿ???是否有任何設置來更改此字符集..Nutch的履帶被爬行'作爲€
0
A
回答
1
’
是單閉合報價(不是撇號)的UTF-8編碼,並且您將它解釋爲Windows-1252。您需要使用正確的編碼(UTF-8)。 This link可能會有所幫助。
1
我沒有用Nutch的自己,但this page看起來像它的相關性:
要啓用UTF-8字符的傳球,編輯$ TOMCAT/conf目錄/ server.xml中。找到<連接>標記的網站(尋找「8080」),並插入此參數分配:的URIEncoding =「UTF-8」作爲http://tomcat.apache.org/faq/connectors.html#utf8
在Tomcat的5 FAQ解釋我不認爲這是因爲的tomcat因爲我的命令提示符也呈現出同樣的事情... – ragaa 2011-02-01 17:02:40