2012-03-26 66 views
1

有沒有簡單的方法來檢測文本塊中的短語模板?短語模板檢測

例如,給定文本:

不知道如何處理這一點。這是非常困難的,而且我很難說我不知道​​該怎麼做。但是對其他人來說可能很明顯?

而且模板:

[X],以及[X]我的意思是[Y]

將導致比賽。

我會假設一些描述的正則表達式是最好的選擇,儘管我不知道這樣的事情是否可以用正則表達式。

獎金:如果試圖連續匹配多個模板,那麼計算效率最高的方法是什麼?

編輯:只是爲了澄清,我只是需要一個完全匹配。例如上面的模板將已符合以下條件:

蘋果,蘋果我的意思梨

回答

1

如果您需要通過正則表達式匹配,你可以用這一個:

(\w+), and by \1 I mean \w+ 

apple, and by apple I mean pineapple -> match 
apple, and by apple I do mean pear -> not match 

(\w+) - matches 1 word and save it to first group 
\1 - word from first group 
\w+ - match second word 

更多http://regexpal.com/

但如果你真的需要匹配播放與正則表達式你需要很多圖案來定義你需要的所有圖案並且構建自己的圖案finite state machine

+0

非常好,謝謝你的鏈接! – 2012-03-27 07:58:00