2015-04-04 120 views
0

我有這樣的代碼:星火/斯卡拉拆分

rdd.map(_.split("-")).filter(row => { ... }) 

當我做row.length上:

  1. 這-is-a的試驗----上split--

  2. 這-is-a的測試-------

輸出是9個4個RE pectively。如果尾部分隔字符爲空,則不計算它們。如果我希望兩個輸出都是10,那麼這裏有什麼解決方法?

回答

2

可以完成你想要什麼用-1作爲極限參數split這樣的:

rdd.map(_.split("-", -1)).filter(row => { ... }) 

順便說一句,預期的結果是11,而不是10(因爲如果你想保持空令牌和你的字符串以分隔符結尾,然後解釋爲該分隔符後面有一個空的標記)。你可以看到this瞭解更多信息。