1
A
回答
3
我見過的技巧很簡單,就是簡單地計算所使用的字符數,並將其除以中文每個單詞的平均字符數。通常用於此的數字是1.5
如果您的中文文本有1500個字符,則它大約有1000個字。
我不知道更精確的計算單詞的方法,除了解釋文本本身。這意味着要真正理解所使用單詞的上下文,因爲中文字符有時可以單獨用作單詞,也可以用作複合詞的組成部分。
+0
這似乎是正確的比例:http://www.proz.com/forum/linguistics/58362-word_count_for_chinese.html。 「1.35:1〜1.8:1。通常我們取1.5:1」 – 2011-12-21 00:02:59
相關問題
- 1. 計算字符串中的字符數
- 2. TI-84計算器語言中的打印字符串
- 3. 計算字符串中的字數?
- 4. Javascript計算字符串中的數字
- 5. 從字符串中提取不同語言的子字符串
- 6. 檢查字符串是否只包含拉丁字符?
- 7. 檢查字符串是拉丁字母還是西里爾文
- 8. 拉丁語言中的highlight.js英語
- 9. DB2 - 計算字符串字符數,不是長度
- 10. 驗證字符串 - 僅限特定語言字符
- 11. 計算字符串中的字符
- 12. 計算不同字符串的數量?
- 13. 計算字符串輸入的字數
- 14. 是否有可能將語言特定的字符轉換爲UTF8中的拉丁字符
- 15. 計算字符串中字符串的數量?
- 16. 的Python 3 - UTF-8字符串str的拉丁字符
- 17. 計算字符串中的位數
- 18. 計算字符串中的句子數
- 19. 計算字符串中的點數
- 20. 拉丁語中的豬拉丁語
- 21. solr搜索從拉丁語到本地語言字符的音譯
- 22. 如何通過規範化版本的字符串匹配拉丁字符和非拉丁字符?
- 23. 計算字符串中的唯一字
- 24. 字符串字段中的計算MySQL
- 25. 用於拉丁字符的php搜索字符串
- 26. 語言字符串ADT
- 27. 語言字符串解析
- 28. 豬拉丁語涉及數字
- 29. 豬拉丁語,for循環,字符串問題
- 30. 創建函數來計算字符串中的字符數
這取決於該語言的單詞定界符。出於好奇,中文單詞如何結束? – Indranil 2011-12-20 23:47:33
這是一個很好的問題。 – dynamic 2011-12-20 23:48:11
這裏是答案:http://www.anycount.com/WordCountBlog/tag/word-count-in-chinese/ – 2011-12-20 23:54:34