2010-09-03 71 views
4

我想對具有多種模式(即多種類型的網絡節點)和多路複用關係(即多種類型的網絡邊緣)的網絡數據進行一些分析。對以RDF表示的網絡數據應用圖表分析

分析可能是關於SNA或應用圖論中的任何算法,例如,關係強度,中心性,中介性,節點距離,塊,集羣等。

源數據是非結構化的,因此我應該首先考慮如何表示,存儲和檢索數據。

以下是一些想法。我會很感激任何反饋或進一步的建議。:)

我知道已經有一些很棒的NoSQL數據庫,例如Neo4J,InfoGrid,用於這種類型的應用程序。但出於一些可擴展性原因(例如許可證,網絡標準...),我希望使用RDF來存儲和表示我的數據。使用的工具將是SESAME或JENA。

用RDF表示網絡/圖形數據的想法是微不足道的。 例如:

網絡/圖形數據

  *Alice* ----lend 100USD----> *Bob* ----- likes ----> *Skiing* 

與RDF

  *Alice* --src--> *lend_relation* <---target--- *Bob* ---likes---> *Skiing* 
            | 
           has_value         
           \|/ 
           *100USD* 

     [Alice   src  lend_relation] 
     [Bob   target lend_relation] 
     [lend_relation has_value 100USD] 
     [Bob   likes  Skiing] 

表示然而,問題是,RDF以及SPARQL圖模型的觀點缺乏。 在RDF查詢之間遍歷節點或查找(最短)距離效率不高。 它必須使用一些額外的分析工具完成,例如JUNG或JGarphT, ,我必須首先通過查詢RDF存儲構建子圖,然後將其轉換爲JUNG或JGraphT使用的數據模型。如果我想要額外的可視化(無論是JUNG還是JGraphT),那麼我必須爲可視化工具包構建另一個數據模型。 我不知道這是一個明確的還是有效的整合。

再次感謝您的任何建議!

+0

「圖模型的觀點」是什麼意思? – 2010-09-03 13:24:27

+0

我的意思是圖遍歷或圖分析。 – elgcom 2010-09-06 10:58:52

回答

2

如果要使用SPARQL對RDF數據進行網絡分析,您可以查看SPARQL 1.1 Property Paths。我相信在耶拿/ ARQ已經實施了ARQ - Property Paths

來自SPARQL新規範的屬性路徑允許您通過定義圖形模式來查詢RDF數據模型。圖表模式比您在SPARQL 1.0中定義的模式要複雜一些。

使用此功能以及應用程序級別的某些邏輯,您可能能夠對數據執行一些有趣的網絡分析。