2017-07-07 106 views
0

我願做星火其中包括在基準:未壓縮數據的星火基準設置

有無10TB的每一行是在這種格式:浮動;浮動;字符串。

作業將基本上做到:上線

  • 地圖上串
  • reduceByKey,其中關鍵是基於兩個浮點數拆分
  • 過濾器。
  • 將結果存儲在HDFS

問題是: - 我應該多少磁盤空間有 - 多少內存 - 什麼是這個職位的參數(#EXEC,#core,#mem)和對於紗線site.conf

目前我有10個節點上(16Cores,16GB,存儲1.5To)存儲的15歲至和失敗,如:

錯誤client.TransportClient:無法發送RPC 6631382768729976966成爲nchophadoopslaves1/ABCD:43365:java.nio.channels.ClosedChannelException java.nio.channels.ClosedChannelException 17/07/06 17時05分42秒

WARN netty.NettyRpcEndpointRef:錯誤發送消息[消息=心跳(41 ,[Lscala.Tuple2; @ 4f4d418,BlockManagerId(41,benchophadoopslaves1,34521))]] 3次嘗試 java.io.IOException:無法將RPC 6631382768729976966發送到benchophadoopslaves1/ABCD:43365:java.nio.channels.ClosedChannelException at org.apache.spark.network.client.TransportClient $ 3.operationComplete(TransportClient.java:239) at org.apache.spark.network.client.TransportClient $ 3.operationComplete(TransportClient.java:226) at io.netty。 util.concurrent.DefaultPromise.not ifyListener0(DefaultPromise.java:680)

回答

0

一位朋友給了我一個提示:給司機10GB。它的工作原理