1
我有一個URL列表,其中一些包括子目錄,查詢參數等。其他一些是不完整的,並且突然停止空間符號或換行符(例如, http://www.google)。正則表達式從URL列表中獲取域(包括頂級)
我想使用一個正則表達式中的grep只匹配結構域(包括協議和頂級域)這些URL,例如,http://www.google.com,http://www.amazon.com等
我用崇高文本2,並用想出了下面的正則表達式,這似乎做的工作:
https?://[^/\n ]*
使用這種在以下方式grep的,但是,失敗:
grep -E "https?://[^/\n ]*"
在日e結果,匹配的URL包括子目錄,查詢路徑等。
grep中的正則表達式有什麼區別,例如在造成這種行爲的Sublime Text中?
你能提供一個樣本輸入文件以及 – anubhava 2014-11-20 16:26:23
'grep'顯示包含正則表達式,而不僅僅是匹配的文本的任何行(整行)。我對「Sublime Text 2」一無所知。 – Jdamian 2014-11-20 17:39:46
@ jdamian這是它沒有工作的原因!我使用-o參數改變了行爲,現在它按需要工作。我添加了相應的答案。謝謝! – erik13579 2014-11-20 19:34:12