2011-02-02 151 views
0

我想將任何html網站上的數據轉換爲rdf。 你知道任何html到rdf轉換器嗎?或者,您爲此目的推薦使用XQuery或GRDDL嗎?將HTML/XML網站轉換爲RDF

+0

這叫做「語義標記」嗎?我認爲沒有可用的自動工具。我知道一個名爲SMORE的工具(在Liyang Yu的「語義Web和語義Web服務介紹」中介紹過)。試試 :) – Songokute 2013-05-10 06:01:54

回答

4

一般來說,自動轉換是不可能的,因爲HTML表示的是什麼東西看起來像,而不是它的意思。如果HTML包含現有標記,則可以使用Anything2Triples(http://developers.any23.org/)來獲取RDF。

如果它只是HTML,你必須以某種方式編寫自己的提取規則。 GRDDL可以工作,但我可能會簡單地使用python + BeautifulSoup。這取決於你已經知道的技術/語言!

0

如果HTML包含嵌入的RDFa,則可以使用RDFa解析器來提取信息。有可用於各種平臺和語言的解析器取決於您的開發環境。