現在這個對我來說是一個很大的挑戰。正則表達式,ANTLR還是其他解決方案?
我大約1000個查詢在一個文件中,所有類似的模式的是去爲得到:
***\*XYZ#PQR#\****
現在,其中#表示任何號碼非空白charecters。
我已經編寫了一段代碼,可以讀取上面的代碼並生成相應的正則表達式。
但是,大約有100,000名候選人,並且我提到了大約1000個這樣的查詢,以便對比賽進行評估。
這使得我的代碼在計算上相當昂貴,因爲它要達到m * n的數量級。
我已經經歷了ANTLR,我發現學習曲線非常陡峭。雖然聽起來很有希望,但在我腦海中的某個角落,如果可以通過使用Antlr實現,我仍然存在疑問。請讓我知道您的意見或任何其他可行的解決方案。
能否請您詳細解釋一下哪些圖案(長度相同,長度不同等),以及您需要怎樣處理它們。 – 2012-04-08 20:13:38
這些模式旨在處理各種關鍵字,如'* * Telecom#Servic#\ *'將匹配'電信服務'。模式長度可以根據關鍵字而變化。我想識別每個變體及其相應的模式。 – 2012-04-08 20:15:42