2017-03-18 170 views
1

我試圖從維基百科頁面的每個文字內容包括使用API​​沙箱上Ballon_d'Or維基百科頁面表中提取。如何通過API提取維基百科頁面WikiTables?

我試着給定的查詢:

https://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles=Ballon_d%27Or&explaintext=1&exsectionformat=wiki 

,但它爲我提供了唯一的文本內容,而不從維基表像這樣的內容:

enter image description here

有沒有一種方法,我可以得到已被獲得與文本信息以及文本格式的表格內容?

或者,我可以用美麗的湯嘗試網頁抓取技術,但我想尋找的查詢方法,先。

+1

不,你必須使用某種HTML解析器。 – Tgr

回答