2017-06-22 100 views
0

我需要python正則表達式爲「www.example.com」(不含引號)。示例可以是任何字符串。 我需要它沒有之前的「WWW」其他任何文本後「.COM正則表達式的URL只是「www.example.com」

+1

你最好不要用自定義正則表達式解析URL,使用庫。 URLs非常複雜:它們可以包含用戶名,密碼,路徑,查詢參數,... –

+0

我不知道這是什麼意思,我只是一個Python初學者。 @WillemVanOnsem –

+0

看看urlparse:https://docs.python.org/3/library/urllib.parse.html – taras

回答

1

可以使用專門的功能從標準庫urllib.parse.urlparse

>>> from urllib.parse import urlparse 
>>> parts = urlparse('http://www.example.org') 
>>> parts 
ParseResult(scheme='http', netloc='www.example.org', path='', params='', query='', fragment='') 
>>> parts.netloc 
'www.example.org' 

或者您可以使用此正則表達式的文本:

>>> import re 
>>> regexp = re.compile(r'\s*(www\.[^:\/\n]+\.com)\s*') 
>>> urls = regexp.findall('Hello https://www.mywebsite.com/index.py?q=search bonjour...') 
>>> urls 
['www.mywebsite.com']