0
我需要python正則表達式爲「www.example.com」(不含引號)。示例可以是任何字符串。 我需要它沒有之前的「WWW」其他任何文本後「.COM」正則表達式的URL只是「www.example.com」
我需要python正則表達式爲「www.example.com」(不含引號)。示例可以是任何字符串。 我需要它沒有之前的「WWW」其他任何文本後「.COM」正則表達式的URL只是「www.example.com」
可以使用專門的功能從標準庫urllib.parse.urlparse:
>>> from urllib.parse import urlparse
>>> parts = urlparse('http://www.example.org')
>>> parts
ParseResult(scheme='http', netloc='www.example.org', path='', params='', query='', fragment='')
>>> parts.netloc
'www.example.org'
或者您可以使用此正則表達式的文本:
>>> import re
>>> regexp = re.compile(r'\s*(www\.[^:\/\n]+\.com)\s*')
>>> urls = regexp.findall('Hello https://www.mywebsite.com/index.py?q=search bonjour...')
>>> urls
['www.mywebsite.com']
你最好不要用自定義正則表達式解析URL,使用庫。 URLs非常複雜:它們可以包含用戶名,密碼,路徑,查詢參數,... –
我不知道這是什麼意思,我只是一個Python初學者。 @WillemVanOnsem –
看看urlparse:https://docs.python.org/3/library/urllib.parse.html – taras