2010-06-15 50 views
0

如何在Linux上使用c + +處理印地文文本的任何建議。 我想從UTF-8編碼的文件中讀取印地文字,並處理它,從中找到一個 特定字。我們該怎麼做?它關於印地文文本在Linux中使用c + +進程

+1

如果您想要一個答案,而不是被標記下來,或者更糟的是關閉,您確實需要提供更多的信息。 – 2010-06-15 07:57:54

+0

你對什麼感興趣?文件的閱讀?搜索?在文件中獲取單詞的位置?查明該單詞是否在文件中?你有沒有嘗試過任何東西? – utnapistim 2010-06-15 08:26:59

回答

1

utf8的設計意味着您不必採取任何特殊編碼的特定步驟。基於char的C++標準庫函數都是8位清理的,所以它們都可以使用utf-8 char不是8位的神祕環境除外)

std::string word = /*the word you are looking for, encoded in utf8*/; 
std::string fileContents = /*the file contents*/; 

std::string::iterator location = fileContents.find(word);