2015-10-13 63 views
0

我想用正則表達式如下:PHP正則表達式爲不同的語言

[a-z' ]*[a-z] 

這不會有不同的語言,如中國的工作。是否有可能創建這個正則表達式的逆版本來執行以下操作:[\pL'-]\pLunicode letter

捕獲由一個空間

"Hey, july 2010" 
=> hey 
=> july 

"hey what's up" 
=> hey what's up 

"漢漢字, 漢漢字 3004303" 
=> 漢漢字 
=> 漢漢字 
+0

您使用哪種編程語言? – melpomene

+0

我正在使用php對不起 –

+0

也許你可以使用一個Unicode類別,如[這裏解釋](http://www.regular-expressions.info/unicode.html)。 「PCRE和PHP不支持Unicode塊,即使它們支持Unicode腳本。」 –

回答

1

首先連接定義你的單詞字符集的字或詞,單引號和連字符)。

在詞語界限內\b[\pL'-]+\b相匹配一個單詞。其次是任何單詞量,即由一個或多個\h+臥式空間,用於最終的圖案preg_match_all開頭:

/\b[\pL'-]+(?:\h+[\pL'-]+)*\b/u 

已經投入模式分隔符,並設置U型改性劑對Unicode的功能。

Demo at regex101.com

+0

這就是我需要的!這澄清了事情,但仍然令人困惑。謝謝你的幫助 –