使用Python Re模塊從多行中提取文本

我想從下面的多行字符串中檢索Auth=值。我試過Python re.match沒有成功。如果我能得到任何幫助，我會感激嗎？使用Python Re模塊從多行中提取文本

SID = DQAAALsAAABCeyCMlOaYMHkv55TUQFxA71fxE1LpgpmL1G_o8YennFwBhar2I_LNmJjGjvLHVQy8tSRfYdLnUIHhKyD0FTZBzXyG_s8U4Pt97n9hPz68ZFSM42Qv6Qxuk74TQygHJXhjLWXNuD5mMsh8_MAs-nmhSToNFIyWoP-uTZ_LN2yQS1o9MB43fzuIIxp-1euXGxMceVVrjyidrYeEB13HS5kMHH-HGjiZhoIJBmu5es7pLPj9Ie8NJZ1K3kFhdVEJa4sLSID = DQAAAL4AAACypRIVyVXcs5zYIeUEt9v-wEwPKgQ8Oe23_URsDeHCg-rR2qQK4dTxPV1J6BPTO-6Zly2H9t4sVhm0vHe8IT6sKLdX2IQ8PgGMtSHQNkpQ8zEan0CyFyUetbSW4af6mlk2pksDpvXNm5GtNTj5eTwkCQUmgGep42u5iuCGFy-o9a1cQWz45NO_J8zIYnBdOqlheNTqaMWpi4hpr-_u8Muzs4RjlEbkuYfDu7MrdsJAFwxf0BVW2cGBtB-K2jwaK7wAuth = 873hdyjsbcvuei73hckwoxnaodbc8dnskc8HU1mKRqxh6yEU-9tqx148GqC7h90_190ZzxpEZOHAH5HTptliylRXvMPyqPyijMNu21bOA6ZhvZFuL8YNB3KF63YuV0n5TFJd1-rMI2LQIdPMVBnsxnEGrLIeFOugAFCZ_3OelAc4XjeKdDvIowxkNnvaooXT4kxtkQWzieA3JRKy3Y-Lbi7E0qiXC99GtHVDh5VWvdTs2LCv3wnRULtLp6ZCoToZ8qoUWMzU9PZldsKSn E

來源

2011-06-15 jwesonga

向我們展示您的代碼不工作 – stema 2011-06-15 21:39:01

嘗試're.search'。 'match'只匹配字符串的開頭。 http://docs.python.org/library/re.html#search-vs-match – 2011-06-15 21:39:23

import re 

text = "SID=DQAAALsAAABCeyCMlOaYMHkv55TUQFxA71fxE1LpgpmL1G_o8YennFwBhar2I_LNmJjGjvLHVQy8tSRfYdLnUIHhKyD0FTZBzXyG_s8U4Pt97n9hPz68ZFSM42Qv6Qxuk74TQygHJXhjLWXNuD5mMsh8_MAs-nmhSToNFIyWoP-uTZ_LN2yQS1o9MB43fzuIIxp-1euXGxMceVVrjyidrYeEB13HS5kMHH-HGjiZhoIJBmu5es7pLPj9Ie8NJZ1K3kFhdVEJa4sLSID=DQAAAL4AAACypRIVyVXcs5zYIeUEt9v-wEwPKgQ8Oe23_URsDeHCg-rR2qQK4dTxPV1J6BPTO-6Zly2H9t4sVhm0vHe8IT6sKLdX2IQ8PgGMtSHQNkpQ8zEan0CyFyUetbSW4af6mlk2pksDpvXNm5GtNTj5eTwkCQUmgGep42u5iuCGFy-o9a1cQWz45NO_J8zIYnBdOqlheNTqaMWpi4hpr-_u8Muzs4RjlEbkuYfDu7MrdsJAFwxf0BVW2cGBtB-K2jwaK7w*Auth=*873hdyjsbcvuei73hckwoxnaodbc8dnskc8HU1mKRqxh6yEU-9tqx148GqC7h90_190ZzxpEZOHAH5HTptliylRXvMPyqPyijMNu21bOA6ZhvZFuL8YNB3KF63YuV0n5TFJd1-rMI2LQIdPMVBnsxnEGrLIeFOugAFCZ_3OelAc4XjeKdDvIowxkNnvaooXT4kxtkQWzieA3JRKy3Y-Lbi7E0qiXC99GtHVDh5VWvdTs2LCv3wnRULtLp6ZCoToZ8qoUWMzU9PZldsKSnE" 
m = re.search('Auth=(.+)',text).groups()[0] 
print m

結果： '* 873hdyjsbcvuei73hckwoxnaodbc8dnskc8HU1mKRqxh6yEU-9tqx148GqC7h90_190ZzxpEZOHAH5HTptliylRXvMPyqPyijMNu21bOA6ZhvZFuL8YNB3KF63YuV0n5TFJd1-rMI2LQIdPMVBnsxnEGrLIeFOugAFCZ_3OelAc4XjeKdDvIowxkNnvaooXT4kxtkQWzieA3JRKy3Y-Lbi7E0qiXC99GtHVDh5VWvdTs2LCv3wnRULtLp6ZCoToZ8qoUWMzU9PZldsKSnE'

來源

2011-06-15 21:56:44 Scott

在你的例子中字符串不是多行的... – 2011-06-15 22:06:08

感謝斯科特·丹利......很難相信它是那麼簡單... – jwesonga 2011-06-15 22:13:32

非-regex版本：'text.split（「Auth =」）[1]' – 2011-06-15 22:23:49

嘗試使用re.search而不是re.match,match checks for a match only at the beginning of the string, while search checks for a match anywhere in the string。

創建正則表達式時，您可能還需要re.MULTILINE標誌，這樣的事情應該做你需要的東西：

re.search("Auth=(.*)", data, re.MULTILINE)

如果驗證不是那麼最後一個值替換.*用正則表達式是將匹配到下一個值。

來源

2011-06-15 21:44:57

不需要正則表達式，循環遍歷行，並拆分=。有點冗長也許......

#!/usr/bin/python 

with open("auth") as fd: 
    for line in fd: 
     if 'Auth' in line: 
      auth=line.split('=')[-1].strip() 
      found=True 
     if found: 
      auth.join(line.strip()) 

*873hdyjsbcvuei73hckwoxnaodbc8dnskc8HU1mKRqxh6yEU-9tqx148GqC7h90_190ZzxpEZOHAH5HTptliylRXvMPyqPyijMNu21bOA6ZhvZFuL8YNB3KF63YuV0n5TFJd1-rMI2LQIdPMVBnsxnEGrLIeFOugAFCZ_3OelAc4XjeKdDvIowxkNnvaooXT4kxtkQWzieA3JRKy3Y-Lbi7E0qiXC99GtHVDh5VWvdTs2LCv3wnRULtLp6ZCoToZ8qoUWMzU9PZldsKSnE

來源

2011-06-15 21:49:24

安德魯的答案是正確的。另外，我會提到命名組功能。

import re 

text = "SID=whateverAuth=myauthvalue" 
m = re.search('Auth=(?P<auth>.+)', text, re.MULTILINE) 
print m.group('auth') #should print myauthvalue

Python的官方文檔：您可以輕鬆地從一個正則表達式提取部分 http://docs.python.org/library/re.html

來源

2011-06-15 22:16:37 LRMAAX

如果字符串爲多，總是以相同的順序（SID，LSID，驗證），您可以使用此：

wantedresult = originalstring.strip().split('\n')[-1].split('=')[-1]

strip必要在原來的字符串末尾刪除多餘的換行符大多數服務器包括。

來源

2011-09-04 18:43:42 heltonbiker

使用Python Re模塊從多行中提取文本

回答

相關問題