2010-01-18 97 views
3

我想通過使用php函數preg_split將字符串與文本拆分爲單詞。將字符串拆分爲帶有瑞典字符的字

$words = preg_split('/\W/u',$text); 

它工作正常,除了瑞典字符liteåäö。做utf8_encode或解碼也沒有幫助。我的猜測是,preg_split只適用於單字節字符和瑞典字符是多字節。還有另一種方法可以做到嗎?

+0

難道你想這樣做在Perl呢?爲什麼perl標籤在這裏? – Ether 2010-01-18 22:32:34

+0

啊,嘿嘿抱歉,但perl的人通常更好的正則表達式:) – Martin 2010-01-18 22:34:30

回答

3

你爲什麼要關注特定的人物?

$text = "Jag har hört så mycket om dig."; 
$words = explode(" ", $text); 
/* 
Array 
(
    [0] => Jag 
    [1] => har 
    [2] => hört 
    [3] => så 
    [4] => mycket 
    [5] => om 
    [6] => dig. 
) 
*/ 
+0

啊,我認爲原因是我想分裂任何不是 - ö。但是,也許我可以循環訪問數組並在之後執行該操作? – Martin 2010-01-18 22:31:10

+1

Dettaärdeträttasvaret。 – Ether 2010-01-18 22:31:17

1

mb_split救援(有這些問題我前一段時間,剛纔找到了答案:)

mb_regex_encoding('UTF-8'); 
mb_split('\W', $text); 

HTH