2010-08-13 58 views
8

給定一個正則表達式,我想生成隨機數據x的時間來測試一些東西。是否有根據正則表達式生成數據的庫? (Python或其他)

例如

>>> print generate_date('\d{2,3}') 
13 
>>> print generate_date('\d{2,3}') 
422 

當然,目標是做一些比電話號碼和電子郵件地址更復雜的事情。

是否存在這樣的事情?如果有,它是否存在Python?如果沒有,我可以使用任何線索/理論來做到這一點?

回答

7

Pyparsing包括this regex inverter,返回簡單的正則表達式所有排列的發電機。下面是一些從該模塊的測試案例:

[A-C]{2}\d{2} 
@|TH[12] 
@(@|TH[12])? 
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9]))? 
@(@|TH[12]|AL[12]|SP[123]|TB(1[0-9]?|20?|[3-9])|OH(1[0-9]?|2[0-9]?|30?|[4-9]))? 
(([ECMP]|HA|AK)[SD]|HS)T 
[A-CV]{2} 
A[cglmrstu]|B[aehikr]?|C[adeflmorsu]?|D[bsy]|E[rsu]|F[emr]?|G[ade]|H[efgos]?|I[nr]?|Kr?|L[airu]|M[dgnot]|N[abdeiop]?|Os?|P[abdmortu]?|R[abefghnu]|S[bcegimnr]?|T[abcehilm]|Uu[bhopqst]|U|V|W|Xe|Yb?|Z[nr] 
(a|b)|(x|y) 

編輯:

做你的隨機選擇,創建一個列表的排列(一次!),然後調用random.choice名單因爲你尋找它

class RandomString(object): 
    def __init__(self, regex): 
     self.possible_strings = list(invRegex.invert(regex)) 
    def random_string(self): 
     return random.choice(self.possible_strings) 
+0

+1太棒了! – katrielalex 2010-08-13 14:18:50

+0

幾乎我在找什麼。 +1 – 2010-08-15 14:44:02

+0

我還在UtilityMill上將此模塊打包爲一個實用程序:http://utilitymill.com/utility/Regex_inverter。所有UM實用程序都公開XML和JSON API,因此您可以從您自己的代碼遠程調用它,並且UtilityMill執行正則表達式反轉處理。 – PaulMcG 2010-08-26 12:48:04

2

There is a post關於生成正則表達式所有排列的模塊的Python郵件列表。我不太確定你怎麼去做隨機化。我會繼續檢查。

+0

+1:每次你想匹配的正則表達式,像這樣(未經測試)一個隨機字符串。 – 2010-08-15 14:44:18

+0

@ e-satis - 實際上我發現它在其他地方:) – detly 2010-08-15 15:06:15

1

我可能會因爲提示這個而被抨擊,但是perl有一個模塊來完成這個工作。你可能想看看代碼是如何實現它在python:

http://p3rl.org/String::Random

+0

SO沒有[鞭]按鈕,所以你很安全。 – detly 2010-08-13 13:47:49

+0

有趣的是知道它存在,至少perl。 +1 – 2010-08-15 14:42:37