試試這個:
import re
line = " A= 4 | B='567' |c=4|D='aaa' "
re.search('(?P<field1>.*)=(?P<value1>.*)\|(?P<field2>.*)=(?P<value2>.*)\|(?P<field3>.*)=(?P<value3>.*)\|(?P<field4>.*)=(?P<value4>.*)', line).groups()
輸出:
(' A', ' 4 ', ' B', "'567' ", 'c', '4', 'D', "'aaa' ")
,你也可以嘗試使用\ S *,而不是*如果你的字段和值做。不包含空格。這將消除輸出的空格:
re.search('(?P<field1>\S*)\s*=\s*(?P<value1>\S*)\s*\|\s*(?P<field2>\S*)\s*=\s*(?P<value2>\S*)\s*\|\s*(?P<field3>\S*)\s*=\s*(?P<value3>\S*)\s*\|\s*(?P<field4>\S*)\s*=\s*(?P<value4>\S*)', line).groupdict()
輸出:
{'field1': 'A',
'field2': 'B',
'field3': 'c',
'field4': 'D',
'value1': '4',
'value2': "'567'",
'value3': '4',
'value4': "'aaa'"
}
這將創建相關羣體:
[ re.search('\s*([^=]+?)\s*=\s*(\S+)', group).groups() for group in re.findall('([^=|]*\s*=\s*[^|]*)', line) ]
輸出:
[('A', '4'), ('B', "'567'"), ('c', '4'), ('D', "'aaa'")]
幫助?
字符串是否可以包含引號或|標記? – 2010-11-18 09:34:27
A = 4 | B ='567'| c = 4 | D ='aaa' – james 2010-11-18 10:02:30
我有數據recodrd A = 4 | B ='567'| c = 4 | D ='aaa'在我正在逐行閱讀的文件中 – james 2010-11-18 10:03:19