Q
語言檢測
4
A
回答
3
本文「Natural Language Identification for OCR Applications」描述了與您的要求類似的識別任務中涉及的技術。
3
我不確定這是否會對Java庫有幫助。但是我發現它非常酷,因爲它能夠從給定的文本中檢測大約50種語言,並且具有相當好的精確度。您可能希望看看它,因爲它是開源的,如果您的應用程序只需要用C++編寫,您可以用C++重寫代碼並將其返回給開源社區。
這裏是鏈接一樣:
http://code.google.com/p/language-detection/
注:它使用了Apache的Nutch和提卡庫進行分析。
0
您可能想要閱讀我的論文The WiLI benchmark dataset for written language identification並嘗試lidtk
。
TL; DR:試一試CLD-2。
相關問題
- 1. 語言檢測
- 2. 檢測iOS語言
- 3. CLI語言檢測
- 4. 語言檢測器
- 5. Solr語言檢測
- 6. 語言檢測API/Library
- 7. 檢測NSString的語言
- 8. 瀏覽器語言檢測
- 9. 檢測輸入語言?
- 10. 較短的語言檢測
- 11. 檢測Android語言支持
- 12. python網站語言檢測
- 13. 檢測編程語言
- 14. 檢測文本的語言
- 15. NLTK和語言檢測
- 16. 微軟認知語言到文本 - 檢測語言
- 17. 檢測瀏覽器語言環境/語言並生成輸出
- 18. 檢測語言和django語言環境-url
- 19. 如何檢測軟鍵盤語言?
- 20. 如何檢測Visualstudio的語言版本?
- 21. Ruby Rails Gem來檢測其他語言
- 22. 極短文本的語言檢測
- 23. 語言檢測重定向(主頁)
- 24. 在java中檢測瀏覽器語言
- 25. 梨包語言檢測上PHP 7
- 26. 在Emacs中自動檢測語言
- 27. 檢測郵件正文的語言
- 28. 檢測手機語言環境
- 29. 如何檢測JavaScript中的語言?
- 30. 檢測Android上htc的ui語言