2011-05-07 224 views
1

我處理包含希臘文和英文(拉丁文)文本的字符串。我想用正則表達式來捕捉所有包含4個或更多字符的希臘字。正則表達式希臘字符編號

使用正則表達式手冊我發現我可以使用\ p {希臘語}來抓取所有希臘語單詞和\ w {4,}以抓取4個以上的字符單詞。但是,從我做的各種測試來看,這兩者不能一起工作。

有沒有什麼辦法做我想要使用1個正則表達式?字符串是UTF-8並從推文中發出。

Regards

+0

告訴我們什麼是你的失敗。我被困在im'agining如何你需要結合這些表達式(afaict'\ w {4,}專注於'\ p {希臘}'爲什麼你需要這兩個?) – sehe 2011-05-07 09:40:12

回答

3

您是否正在使用UTF-8模式修飾符?

/\p{Greek}{4,}/u 
+0

謝謝,工作正常:-) – 2011-05-07 17:58:52