cloudera

0熱度

2回答

我在HDFS @/user/Cloudera/Test/中有一些數據。我非常能夠通過運行「hdfs -dfs -cat Test/」來查看記錄。現在是同一個文件，我需要它在scala中讀作RDD。我已經在scala shell中嘗試了以下內容。 VAL文件= sc.textFile（「HDFS：//quickstart.cloudera：8020 /用戶/ Cloudera的/測試」）然後

0熱度

1回答

SAP HANA Vora 1.3 - 無法在CM 5.0上啓動Cloudera 5.7上的Vora Manager 012

我無法在Cloudera上部署SAP HANA Vora 1.3地塊。我希望我沒有從SAP沃拉管理一切必要步驟指南 http://help.sap.com/Download/Multimedia/hana_vora/SAP_HANA_Vora_Installation_Admin_Guide_1.3_en.pdf 以下設置：的Cloudera管理器5.7 CDH 5.7.5（也試過5.8/5.9

1熱度

1回答

無法在Spark中配置ORC屬性

我正在使用Spark 1.6（Cloudera 5.8.2）並嘗試下面的方法來配置ORC屬性。但它不影響輸出。下面是我試過的代碼片段。 DataFrame dataframe = hiveContext.createDataFrame(rowData, schema); dataframe.write().format("orc").options(new HashMap(){

0熱度

2回答

Python中的Spark使用元組 - 我如何在加入兩個RDD後合併兩個元組

我在Spark環境和開發中有點新意。我有兩個RDDS中，我通過一個木匠合併，那木匠的結果如下： (u'10611', ((u'Laura', u'Mcgee'), (u'66821', u'COMPLETE'))) (u'4026', ((u'Mary', u'Smith'), (u'3237', u'COMPLETE'))) (u'4026', ((u'Mary', u'Smith'),

0熱度

1回答

如何將mysql表中的數據加載到cloudera中（使用虛擬框啓動）

我有一個使用WAMP服務器訪問的Web應用程序，它詢問用戶當前位置並獲取他的經度和緯度。這些緯度和經度值存儲在mysql數據庫的表中。現在我需要處理這個經度和緯度值，以給用戶他/她最近的位置。所以我想將這些經緯度值在mysql數據庫中導入到hadoop中。我安裝了cloudera並使用虛擬框啓動它。現在Cloudera的命令提示符下，當我嘗試使用這樣 $ bin/sqoop import

0熱度

1回答

Cloudera HUE - HIVE不認識查詢

CREATE TABLE schema.table1 ( DATE_OUT STRING COMMENT 'Date', STATUS_OUT STRING COMMENT 'Status', SHIP_NR_OUT STRING COMMENT 'Shipper Number', TABLE_NAME_OUT STRING COMMENT '

3熱度

2回答

無法即使是在線程指定-Djava.library.path =/*/*/

異常「主要」 java.lang.RuntimeException: native snappy library not available: this version of libhadoop was built without snappy support. at org.apache.hadoop.io.compress.SnappyCodec.checkNativeCodeLoaded(

0熱度

1回答

Hadoop KMS不推薦？

雖然閱讀：Cloudera KMS Installation procedure，我發現 Cloudera的強烈建議不要在生產環境中使用Java密鑰KMS。我找不到任何背後的建議。 Cloudera實施（受託人）修復了哪些已知風險？

0熱度

1回答

創建後Hive外部表分隔符損壞

我有一個帶有分隔符分隔符的源文件。我的蜂巢外部桌子也是用破損的管道分隔符創建的。但創建表後，我看到了像'j'這樣的分隔符。我也無法從表中查詢。創建語法：試圖用ASCII值 PARTITIONED BY ( eventdate date) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\u00A6' STORED AS PARQUE

0熱度

1回答

批量插入Impala需要太多時間

我正在使用Impala JDBC驅動程序批量向Impala插入數據。我目前的批量大小爲1000，並使用PreparedStatement的INSERT INTO VALUES子句執行批量查詢。 Impala Daemon在3臺機器上運行，Impala Catalog Server，State store在4臺機器上運行。在因帕拉的批量插入查詢計劃是這樣的： Query Timeline: 35s