hortonworks-data-platform

    0熱度

    1回答

    我有一些流從azure eventhub獲取數據,即時使用GetAzureEventhub處理器。我得到的數據正在乘以集羣中的節點數,我有4個節點。如果我指示處理器僅在主節點上運行,則數據不會被複制4次。 我發現每個消費者組的eventhub最多接受5個閱讀器,我在this article中閱讀這個閱讀器,每個閱讀器都有自己獨立的偏移量,並且它們使用相同的數據。所以最後我讀了4次相同的數據。 我有

    2熱度

    3回答

    我最近下載了Apache的hadoop發行版,並啓動並運行得非常快;下載hadoop瀝青球,在一個位置和一些配置設置下解開它。這裏的事情是我能夠看到各種配置文件,如:yarn-site.xml,hdfs-site.xml等;我知道哈多普家的位置。 接下來,我安裝了hadoop(HDP)使用Ambari。 這裏是混淆部分。看來Ambarin在/ usr/hdp中安裝了hdp;然而,普通香草hadoo

    0熱度

    2回答

    我使用Apache Ambari安裝了HDP,並看到它使用內置的默認數據庫 - > PostgreSQL。 使用Apache Ambari安裝HDP的數據庫需要什麼?

    1熱度

    1回答

    我在Azure中創建了HDInsight的Spark羣集。現在我想將處理後的數據存儲到HBASE中,我不想創建單獨的HBASE HDInsight羣集,並使用VNET連接到Spark羣集。 這是因爲我們限制每個區域60個核心(例如,東部美國2)。我已經並且想要爲我的Spark Cluster使用全部60個內核。所以想到在HDInsight的Spark Cluster中安裝HBASE。 它似乎有一個

    1熱度

    1回答

    HDP-2.5.3.0。 自定義處理器使用State API來保存一些數據。 try { stateMap = stateManager.getState(Scope.CLUSTER); stateMapProperties = new HashMap<>(stateMap.toMap()); logger.debug("Retrieved the statemap : " + stateM

    2熱度

    1回答

    由confluent開發的模式註冊表現在被推送到開源,它是否已被Hortonworks HDP採用? 我期待的答案是 沒有HDP卡夫卡沒有架構註冊表capablities 是HDP具有架構註冊表 - 該版本是XX 沒有,但有類似的架構註冊表東西它被稱爲 「XXXX」

    0熱度

    1回答

    我在Spark和Ambari的集羣安裝上比較新。最近,我得到了一個安裝Spark 2.1.0的任務,它在預裝了Ambari Spark 1.6.2的HDFS & YARN 2.7.3的集羣上。 我的任務是安裝Spark 2.1.0,因爲它是與RSpark更好的兼容性的最新版本。我在網上搜索了幾天,僅在AWS或Spark 2.1.0上找到了一些安裝指南。 如下: http://data-flair.

    0熱度

    1回答

    我寫了一個hbase java客戶端,如下所示。 package hbase; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase

    0熱度

    1回答

    我需要知道如何在Hadoop等分佈式系統上執行hive查詢。我查了其他問題,但沒有一個詳細解釋。 我正在尋找完整的執行過程。正如我想知道爲什麼蜂巢連接查詢比簡單選擇查詢花費更多時間。 任何人都知道蜂巢執行過程,請解釋。 PS:我使用hortonworks數據平臺作爲Hadoop框架。

    0熱度

    2回答

    我有一個HANA Express VM,我想與Hadoop集羣進行交互。我有一個通過智能數據訪問(SDA)連接到HANA的Hive表。一切工作正常與虛擬表,我可以使用SAP HANA Studio進行查詢蜂房數據(select語句),但是當我嘗試計數表中的行,我在HANA工作室得到一個異常: SELECT count(*) FROM "SYSTEM"."orctable"; 導致以下情況除外: