2011-06-16 71 views
2

嗨如何使用python將文章的網址轉換爲打印網址。用Python切片url

文章的URL:http://www.indianexpress.com/news/second-time-as-farce/800228/0

打印網址:HTTP://www.indianexpress.com/story-print/800228/

如何將文章url轉換爲打印url?

回答

6

使用urllib.parse.urlparse()從URL的其餘部分雕刻路徑,posixpath.split()posixpath.join()改革路徑,urllib.parse.urlunparse()再次把它全部重新走到一起。

+0

出於好奇,是否需要posixpath? urlparse總是會返回一個正斜槓。 – Jordan 2011-06-16 05:05:09

+0

你不想使用'os.path',因爲在Windows上會給你'ntpath'。 – 2011-06-16 05:05:58

+0

在這種情況下硬編碼正斜槓是否有問題? – Jordan 2011-06-16 05:07:32

0
from urllib.parse import urlparse 

def transform(url): 
    parsed = urlparse(url) 
    return '{0}://{1}/story-print/{2}/'.format(parsed.scheme, parsed.netloc, parsed.path.split('/')[-2]) 
+0

一定要檢查標籤。 – 2011-06-16 05:04:51

+0

被誤解。我更新了導入。 – Jordan 2011-06-16 05:09:05