cloudera

    0熱度

    2回答

    我在HDFS @/user/Cloudera/Test/中有一些數據。我非常能夠通過運行「hdfs -dfs -cat Test/」來查看記錄。 現在是同一個文件,我需要它在scala中讀作RDD。 我已經在scala shell中嘗試了以下內容。 VAL文件= sc.textFile( 「HDFS://quickstart.cloudera:8020 /用戶/ Cloudera的/測試」) 然後

    0熱度

    1回答

    我無法在Cloudera上部署SAP HANA Vora 1.3地塊。我希望我沒有從SAP沃拉管理一切必要步驟指南 http://help.sap.com/Download/Multimedia/hana_vora/SAP_HANA_Vora_Installation_Admin_Guide_1.3_en.pdf 以下設置: 的Cloudera管理器5.7 CDH 5.7.5(也試過5.8/5.9

    1熱度

    1回答

    我正在使用Spark 1.6(Cloudera 5.8.2)並嘗試下面的方法來配置ORC屬性。但它不影響輸出。 下面是我試過的代碼片段。 DataFrame dataframe = hiveContext.createDataFrame(rowData, schema); dataframe.write().format("orc").options(new HashMap(){

    0熱度

    2回答

    我在Spark環境和開發中有點新意。 我有兩個RDDS中,我通過一個木匠合併,那木匠的結果如下: (u'10611', ((u'Laura', u'Mcgee'), (u'66821', u'COMPLETE'))) (u'4026', ((u'Mary', u'Smith'), (u'3237', u'COMPLETE'))) (u'4026', ((u'Mary', u'Smith'),

    0熱度

    1回答

    我有一個使用WAMP服務器訪問的Web應用程序,它詢問用戶當前位置並獲取他的經度和緯度。 這些緯度和經度值存儲在mysql數據庫的表中。 現在我需要處理這個經度和緯度值,以給用戶他/她最近的位置。 所以我想將這些經緯度值在mysql數據庫中導入到hadoop中。 我安裝了cloudera並使用虛擬框啓動它。 現在Cloudera的命令提示符下,當我嘗試使用這樣 $ bin/sqoop import

    0熱度

    1回答

    CREATE TABLE schema.table1 ( DATE_OUT STRING COMMENT 'Date', STATUS_OUT STRING COMMENT 'Status', SHIP_NR_OUT STRING COMMENT 'Shipper Number', TABLE_NAME_OUT STRING COMMENT '

    3熱度

    2回答

    異常「主要」 java.lang.RuntimeException: native snappy library not available: this version of libhadoop was built without snappy support. at org.apache.hadoop.io.compress.SnappyCodec.checkNativeCodeLoaded(

    0熱度

    1回答

    雖然閱讀:Cloudera KMS Installation procedure,我發現 Cloudera的強烈建議不要在生產環境中使用Java密鑰KMS。 我找不到任何背後的建議。 Cloudera實施(受託人)修復了哪些已知風險?

    0熱度

    1回答

    我有一個帶有分隔符分隔符的源文件。我的蜂巢外部桌子也是用破損的管道分隔符創建的。但創建表後,我看到了像'j'這樣的分隔符。我也無法從表中查詢。 創建語法: 試圖用ASCII值 PARTITIONED BY ( eventdate date) ROW FORMAT DELIMITED FIELDS TERMINATED BY '\u00A6' STORED AS PARQUE

    0熱度

    1回答

    我正在使用Impala JDBC驅動程序批量向Impala插入數據。我目前的批量大小爲1000,並使用PreparedStatement的INSERT INTO VALUES子句執行批量查詢。 Impala Daemon在3臺機器上運行,Impala Catalog Server,State store在4臺機器上運行。 在因帕拉的批量插入查詢計劃是這樣的: Query Timeline: 35s