hortonworks-data-platform

0熱度

1回答

我有一些流從azure eventhub獲取數據，即時使用GetAzureEventhub處理器。我得到的數據正在乘以集羣中的節點數，我有4個節點。如果我指示處理器僅在主節點上運行，則數據不會被複制4次。我發現每個消費者組的eventhub最多接受5個閱讀器，我在this article中閱讀這個閱讀器，每個閱讀器都有自己獨立的偏移量，並且它們使用相同的數據。所以最後我讀了4次相同的數據。我有

2熱度

3回答

簡單的香草Hadoop安裝與使用Ambari的Hadoop安裝

我最近下載了Apache的hadoop發行版，並啓動並運行得非常快;下載hadoop瀝青球，在一個位置和一些配置設置下解開它。這裏的事情是我能夠看到各種配置文件，如：yarn-site.xml，hdfs-site.xml等;我知道哈多普家的位置。接下來，我安裝了hadoop（HDP）使用Ambari。這裏是混淆部分。看來Ambarin在/ usr/hdp中安裝了hdp;然而，普通香草hadoo

0熱度

2回答

數據庫在Ambari中用於安裝HDP的角色？

我使用Apache Ambari安裝了HDP，並看到它使用內置的默認數據庫 - > PostgreSQL。使用Apache Ambari安裝HDP的數據庫需要什麼？

1熱度

1回答

如何在Azure HDInsight的Spark Cluster中配置HBase？

我在Azure中創建了HDInsight的Spark羣集。現在我想將處理後的數據存儲到HBASE中，我不想創建單獨的HBASE HDInsight羣集，並使用VNET連接到Spark羣集。這是因爲我們限制每個區域60個核心（例如，東部美國2）。我已經並且想要爲我的Spark Cluster使用全部60個內核。所以想到在HDInsight的Spark Cluster中安裝HBASE。它似乎有一個

1熱度

1回答

檢索kerberized集羣中的狀態映射時出錯

HDP-2.5.3.0。自定義處理器使用State API來保存一些數據。 try { stateMap = stateManager.getState(Scope.CLUSTER); stateMapProperties = new HashMap<>(stateMap.toMap()); logger.debug("Retrieved the statemap : " + stateM

2熱度

1回答

HDP Kafka模式註冊表

由confluent開發的模式註冊表現在被推送到開源，它是否已被Hortonworks HDP採用？我期待的答案是沒有HDP卡夫卡沒有架構註冊表capablities 是HDP具有架構註冊表 - 該版本是XX 沒有，但有類似的架構註冊表東西它被稱爲「XXXX」

0熱度

1回答

使用Ambari安裝spark 2.1.0 2.4.2.0

我在Spark和Ambari的集羣安裝上比較新。最近，我得到了一個安裝Spark 2.1.0的任務，它在預裝了Ambari Spark 1.6.2的HDFS & YARN 2.7.3的集羣上。我的任務是安裝Spark 2.1.0，因爲它是與RSpark更好的兼容性的最新版本。我在網上搜索了幾天，僅在AWS或Spark 2.1.0上找到了一些安裝指南。如下： http://data-flair.

0熱度

1回答

Hbase ResultScanner拋出一個空指針異常

我寫了一個hbase java客戶端，如下所示。 package hbase; import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase

0熱度

1回答

如何在hadoop中執行hive查詢

我需要知道如何在Hadoop等分佈式系統上執行hive查詢。我查了其他問題，但沒有一個詳細解釋。我正在尋找完整的執行過程。正如我想知道爲什麼蜂巢連接查詢比簡單選擇查詢花費更多時間。任何人都知道蜂巢執行過程，請解釋。 PS：我使用hortonworks數據平臺作爲Hadoop框架。

0熱度

2回答

SAP HANA智能數據訪問：無法統計虛擬表（Hive）的行

我有一個HANA Express VM，我想與Hadoop集羣進行交互。我有一個通過智能數據訪問（SDA）連接到HANA的Hive表。一切工作正常與虛擬表，我可以使用SAP HANA Studio進行查詢蜂房數據（select語句），但是當我嘗試計數表中的行，我在HANA工作室得到一個異常： SELECT count(*) FROM "SYSTEM"."orctable"; 導致以下情況除外：