2017-02-03 80 views
0

嘗試使用Scrapy刮取圖像鏈接。Scrapy不抓取url中的百分比符號

這是我刮的鏈接。

http://www.cars4sale.com/carimages/20TH%FEB%032.JPG

這是它如何被保存在JSON文件。請注意,百分號已被替換爲空格。

http://www.cars4sale.com/carimages/20TH FEB 032.JPG

所以,當我顯示這個鏈接,我得到一個404錯誤,因爲該鏈接是錯誤的。

我該如何讓Scrapy颳去百分比符號?

+0

我不知道關於scrapy,但我想到代替」 與 「%」(空格) 「(百分比)在ifnal網址將爲你做的工作 –

回答

1

可以使用

urllib.quote(urlWithSpaceInIt) 

你不必做任何事情來的scrapy東西。在去之前只需引用網址。

0

好的,感謝您的評論,但我沒有足夠的經驗來解決任何建議的方式,但他們幫助我得到最終的代碼,爲我工作。

這也證明,有20%,我沒有注意到之前。

以下是我在JavaScript中爲URL添加了%20。

IMG SRC = 「+數據[I] .img.replace(/ | /克, 」%20「)