2015-11-04 64 views
0

我在pyspark與數據,如低於層次化查詢在蜂巢

node 1: 
node 3: 1 
node 5: 1 
node 2: 3 
node 4: 2 

現在我需要知道節點4的所有的家長,一個數據幀,這樣我得到這樣

1,3,2 
輸出

這可能使用Hive SQL查詢嗎?

+0

4是自己的父母嗎? – gobrewers14

+0

4不是其本身的父母。 4有父節點2,2有父節點3,3有父節點1,1是根節點 – mhn

+1

「我需要知道節點4的所有父節點***」=> output:'1,2,3,4 '暗示'4'是4的父親。 – gobrewers14

回答

0

SQL本身不支持迭代,也不遞歸...

  • CONNECT BY條款,你可以只讓數據庫處理遞歸,假裝很容易>>搜索蜂巢
  • 不可用使用程序語言包裝器(例如T-SQL,PL/SQL,PgSQL),您可以迭代直到每個葉片都連接到根目錄(...詳細代碼,沒有用於測試的樂趣...)>> Hive中不提供,除非您使用Python來管理迭代並在每次迭代中運行INSERT查詢,然後收集結果