1
我試圖從維基百科頁面的每個文字內容包括使用API沙箱上Ballon_d'Or維基百科頁面表中提取。如何通過API提取維基百科頁面WikiTables?
我試着給定的查詢:
https://en.wikipedia.org/w/api.php?action=query&format=json&prop=extracts&titles=Ballon_d%27Or&explaintext=1&exsectionformat=wiki
,但它爲我提供了唯一的文本內容,而不從維基表像這樣的內容:
有沒有一種方法,我可以得到已被獲得與文本信息以及文本格式的表格內容?
或者,我可以用美麗的湯嘗試網頁抓取技術,但我想尋找的查詢方法,先。
不,你必須使用某種HTML解析器。 – Tgr