2017-04-02 117 views
-4

如何編寫從列表中獲取字符串的軟件,並根據列表中每行的模式生成正則表達式。正則表達式+人工智能

+0

你能舉一個你的列表和你的模式/表達式的例子嗎? – CoronA

回答

0

由於正則表達式是正則表達式,這意味着它們用於匹配定義良好的模式。如果您需要一種模糊匹配,則不需要正則表達式或者有效。如果您需要「查找類似文本」算法,請不要使用正則表達式並使用機器學習算法之一。 Google「機器學習算法」。

順便說一句,製作一個能夠生成匹配一組字符串的正則表達式的程序並不難,但如果僅用於有趣或學習的目的,這將是有意義的,我無法想象它還有什麼用處對於。

例如,如果「看起來像電子郵件地址」那樣,您可以獲得匹配的表達式,但您確實無法確定它是否爲電子郵件地址,因爲要確定您需要嚴格的適用的規則,這些規則無法從任何真實世界的電子郵件地址樣本中自動確定,這些地址明顯小於所有現有電子郵件帳戶的實際數量。

如果我會做那樣的事情,我會首先「提取」長度的規則。不能短於最短,不能長於最長。然後將字符集限制爲僅存在於集合中,或者擴展爲完整的字母數字。沒有特殊字符延伸。它可能適用於某些情況,對其他情況失敗。