匹配拉丁字母，包括塞爾維亞 - 克羅地亞語字符

我試圖用PHP編寫一個正則表達式（正則表達式）來匹配所有的拉丁字母，包括具體的那些塞爾維亞 - 克羅地亞語，如「ćčđšž」匹配拉丁字母，包括塞爾維亞 - 克羅地亞語字符

這裏我的代碼：

public function alpha_space($str) 
{ 
    return (! preg_match("/^([-a-z0-9_ ])+$/i", $str)) ? FALSE : TRUE; 
}

我應該如何修改此代碼段，以便正則表達式也適用於塞爾維亞克羅埃西亞語字母？

謝謝你的任何想法，你想提供。

來源

2017-06-05 Admir Husić

你只想讓一些字母或全部「塞爾維亞您可以通過使用u標誌限制由碼點字-croatian「字母？「塞爾維亞克羅地亞」西里爾文字符？你可能想看看http://php.net/manual/en/regexp.reference.unicode.php。 – chris85

這些都是Unicode的拉丁成員擴展塊，肚裏從0100到0x017F。

$test = "ćčđšž"; 
$start = "100"; 
$finish = "17f"; 
$pattern = "/^[\x{{$start}}-\x{{$finish}}]*$/u"; 
$result = preg_match($pattern, $test); 
var_dump($result);

所以這延伸到你原來的模式將是這個樣子：

$pattern = "/^[-a-z0-9_ \x{100}-\x{17f}]+$/ui";

來源

2017-06-06 00:06:44 miken32

您可以使用正則表達式\p{L}來匹配任何Unicode字母。

這會改變你的正則表達式：^([-\p{L}0-9_ ])+$

public function alpha_space($str) 
{ 
return (! preg_match("/^([-\p{L}0-9_ ])+$/i", $str)) ? FALSE : TRUE; 
}

Here's a fiddle.

來源

2017-06-05 23:51:17 Daniel

這是一個非常多的字母！ – miken32

只有幾十萬。 ;） – Daniel

匹配拉丁字母，包括塞爾維亞 - 克羅地亞語字符

回答

相關問題