2012-02-06 129 views
1

我想要一個讀取文檔中的文本並說它是用哪種語言(英語,西班牙語,...)的java代碼。文件的格式並不重要。我希望輸出是例如:「這份文件是西班牙文」。請以這種方式引導我,並給我一個示例代碼。語言檢測器

+0

大多數文檔格式將該信息嵌入其元數據中。對於純文本文件,是的,你必須做一些魔術。 – 2012-02-06 16:20:21

+0

這是問題解答網站,那麼你的問題是什麼,我建議閱讀常見問題解答... – Nettogrof 2012-02-06 16:21:34

+0

你需要根據所使用的單詞使用猜測。我會爲每種語言創建一個單詞詞典並嘗試匹配它們。注:一些簡短的文件可能是。 – 2012-02-06 16:21:37

回答

0

language-detection庫在Java中使用非常簡單(請參閱示例代碼)和健壯性。檢測來自各種家庭的至少53種語言。