從HTTP響應解析Json字符串

-1

我想解析來自Python中HTTP請求的JSON響應。但我收到以下異常：從HTTP響應解析Json字符串

ValueError: No JSON object could be decoded

Python代碼：

profile = webdriver.FirefoxProfile() 
profile.set_preference('network.http.phishy-userpass-length', 255) 
browser = webdriver.Firefox(firefox_profile=profile) 
browser.get("https://"+username+":"+password+"@"+url) 
htmltext= str(browser.page_source) 
html=soup(htmltext) 
jsondata= str(html.find('pre')).strip('</pre>') 
data=json.loads(jsondata) 
print data['entries']

JSON響應：

{ 
    "count":1, 
    "entries": 
    [ 
     { 
     "id":15862, 
     "application":loginAudit, 
     "user":[email protected], 
     "time":"2014-10-30T02:08:14.103-04:00", 
     "values": 
     { 
       "\/loginAudit\/login\/no-error\/user":"[email protected]" 
     } 

     } 
    ] 
}

來源

2014-11-03 charan

我沒有看到你初始化jsondata。 – 2014-11-03 10:11:39

'jsondata'從哪裏來？ – 2014-11-03 10:12:36

請注意，您在此處發佈的JSON無效; 'application'和'user'值沒有引號。你可以通過使用linter來測試某些東西是否是有效的JSON。 JSONLint.com提供一個在線。 – 2014-11-03 10:14:42

我在這裏看到的幾個問題，但兩人脫穎而出的大多是：

你正在使用BeautifulSoup解析頁面。如果你真的只接收到你發佈的類似JSON的文本，BeautifulSoup就不能解析它。即使它沒有拋出錯誤，輸出將會是某種形式的HTML，而不是JSON。
您顯示的頁面實際上並不是有效的JSON。根本沒有引用application和user的值。

我也有些困惑，爲什麼你使用Selenium來得到迴應。除非在特定頁面上執行了JavaScript（爲此您確實可以使用真實的瀏覽器來執行它），那麼您似乎正在使用推土機來嘗試破解螺母。

使用標準庫工具（urllib2或urllib.request，取決於您的Python版本）應該就足夠了，也許只需設置一些明確的HTTP標頭即可。就我個人而言，我會使用requests module來完成這些任務;它甚至帶有內置的JSON處理。

來源

2014-11-03 10:32:33

其實我並沒有越來越簡單的JSON字符串作爲響應，但一個HTML字符串，因此我用BeautifulSoup來解析它，並找到存儲在標籤內的JSON。我沒有公佈所有這些細節。對不起，不清楚 – charan 2014-11-03 10:35:31

@charan：可能是因爲你的提取方法不正確。這可能是你解析出的是JavaScript，而不是嚴格的JSON。這可能是因爲你想要提取的信息更好地使用正則表達式來處理，等等。這就是爲什麼你需要a）清楚你真正解決了什麼問題（而不僅僅是你自己試圖解決的問題）和b）給我們一個可重複的樣本，所以我們可以嘗試和排除故障。你們兩個都不給我們，所以我可以給你的只是一般的建議。 – 2014-11-03 10:39:07

使用Selenium的原因是我正在訪問的URL是使用自簽名證書，因此在使用urllib2庫時會拋出與SSL相關的異常。感謝@Martijin我會記住你的建議。 – charan 2014-11-03 10:42:15

從HTTP響應解析Json字符串

回答

相關問題