cloudera

    0熱度

    1回答

    我是這個領域的新手。我正在檢查CDH 5.8快速啓動VM以嘗試一些基本的配置單元/ impala示例。 但是我遇到了一個問題,當我打開HUE時,它給出了以下錯誤。我搜索解決方案,但沒有得到任何可以解決我的問題。 Configuration files located in /etc/hue/conf.empty Potential misconfiguration detected. Fix

    1熱度

    1回答

    我們剛剛從CDH 5.3.6升級到5.10.0,並在嘗試寫入Kafka主題時開始出現錯誤。我們有一切默認設置,沒有啓用SSL或Kerberos身份驗證。當使用控制檯生產者寫我的話題之一,我得到這個錯誤: /usr/bin/kafka-console-producer --broker-list = myhost1.dev.com:9092,myhost2.dev。 COM:9092 --topic

    0熱度

    1回答

    我目前停留在嘗試設置將能夠對遠程Impala服務器執行impala查詢的Python代碼。 在我的本地Windows我使用已經建立並可以成功地應用在的Tableau檢索與帕拉數據的ODBC驅動程序。 我們使用的Hadoop環境是Kerberised。 要使用ODBC管理員進行成功的連接測試,我們需要SASL和可信的.pem證書。 我已經嘗試使用多個庫連接,但我不知道如何設置連接屬性和我需要。 我嘗

    0熱度

    1回答

    我正在關注cloudera blog on using spark-ts for time series analysis in scala。我想用小時頻率創建一個DateTimeIndex。在博客中的例子顯示瞭如何創建工作日頻率DateTimeIndex如下: val dtIndex = DateTimeIndex.uniform( new DateTime("2015-08-03"),

    2熱度

    2回答

    在Hadoop Yarn中,下面是觀察值: a)對於每個InputSplit或塊,將會觸發一個新的地圖。 b)羣集的典型塊大小爲128 MB。 c)在大多數羣集中,MapReduce.map.memory.mb的配置大於1 GB。 其實對於Cloudera的塊大小的建議是128 MB和MapReduce.map.memory.mb爲1 GB 當塊大小隻有128 MB,爲什麼我們需要1 GB分配給映

    1熱度

    1回答

    我試圖執行的HQL SELECT t.retweeted_screen_name, sum(retweets) AS total_retweets, count(*) AS tweet_count FROM (SELECT retweeted_status.user.screen_name as retweeted_screen_name,

    0熱度

    1回答

    我正在5.8.2版本的Yarn上運行Cloudera集羣。資源管理器的 調度程序正在以Fair調度程序運行。 YARN的動態資源池設置處於活動狀態。池是在root.users下生成的 .. 我想要的是增加特定用戶的資源。所以我將動態資源配置中這個用戶的權重從「1」改爲 「3」。 假設我有三個用戶USER1到USER3並且具有以下的提示。 USER1是3,USER2是1,USER3是1. 我是對的,

    0熱度

    1回答

    在嘗試超過10十億條記錄轉儲到HBase的,這將 平均增長在10萬左右一天,然後試圖在記錄的全表掃描 讀取行。我知道全面掃描hdfs將 比hbase更快。 Hbase正在用於對hdfs上的不同數據 進行排序。該應用程序正在使用spark構建。 數據被批量加載到hbase上。由於各種2G限制,3G的初始測試將區域大小降至1.2G(仍需要進一步詳細調查)。 掃描緩存爲1000,緩存塊關閉 總的hbas

    0熱度

    1回答

    您好我有一個運行Hadoop集羣(CDH 5.8.x),並使用了Cloudera管理器來管理Hadoop集羣 了Cloudera管理器提供動態資源池配置。 使用配置,我可以限制應用程序編號,以特定的用戶 該圖是示出這樣 我設置MCHA只能使用一個應用程序。 但MCHA可以執行多個應用程序 我做了什麼錯嗎?

    0熱度

    2回答

    我想列出CM的配置值。所以我有這樣的代碼,正在型動物羣(5.9.1,5.10.0和5.8.3): from cm_api.api_client import ApiResource cm_host = "XX.XX.70.12" api = ApiResource(cm_host, username="supervision-user", password="XXXXXX") cm_co