我想通過使用php函數preg_split將字符串與文本拆分爲單詞。將字符串拆分爲帶有瑞典字符的字
$words = preg_split('/\W/u',$text);
它工作正常,除了瑞典字符liteåäö。做utf8_encode或解碼也沒有幫助。我的猜測是,preg_split只適用於單字節字符和瑞典字符是多字節。還有另一種方法可以做到嗎?
我想通過使用php函數preg_split將字符串與文本拆分爲單詞。將字符串拆分爲帶有瑞典字符的字
$words = preg_split('/\W/u',$text);
它工作正常,除了瑞典字符liteåäö。做utf8_encode或解碼也沒有幫助。我的猜測是,preg_split只適用於單字節字符和瑞典字符是多字節。還有另一種方法可以做到嗎?
你爲什麼要關注特定的人物?
$text = "Jag har hört så mycket om dig.";
$words = explode(" ", $text);
/*
Array
(
[0] => Jag
[1] => har
[2] => hört
[3] => så
[4] => mycket
[5] => om
[6] => dig.
)
*/
mb_split
救援(有這些問題我前一段時間,剛纔找到了答案:)
mb_regex_encoding('UTF-8');
mb_split('\W', $text);
HTH
難道你想這樣做在Perl呢?爲什麼perl標籤在這裏? – Ether 2010-01-18 22:32:34
啊,嘿嘿抱歉,但perl的人通常更好的正則表達式:) – Martin 2010-01-18 22:34:30