我有下面的語句在腳本中,用一個可靠的格式檢索從各種郵件日誌的電子郵件地址的域名部分:線:如何正確地將unicode字符與awk的正則表達式匹配?
awk '/^To:/{ r = gensub(/^To: [email protected](.+) .*$/, "\\1", "g"); print r}'
這符合線,如To: [email protected] (Omer)
。但是,它與電子郵件地址後面的尾部括號內的行To: [email protected] (André)
或To: [email protected] (Pål)
以及任何其他非線性字符行不匹配。
順便說一句,對於od -c
第一個不匹配的例子給出了:
0000000 T o : a n d y . v i t r e l l
0000020 a @ u o l . c o m . b r ( A n
0000040 d r 351 ) \n
0000045
我猜測有東西在(André)
與awk的正則表達式的.
不匹配的非ASCII字符回事。什麼是正確的正則表達式匹配這樣一條線?