0
我有這樣的代碼:星火/斯卡拉拆分
rdd.map(_.split("-")).filter(row => { ... })
當我做row.length上:
這-is-a的試驗----上split--
這-is-a的測試-------
輸出是9個4個RE pectively。如果尾部分隔字符爲空,則不計算它們。如果我希望兩個輸出都是10,那麼這裏有什麼解決方法?
我有這樣的代碼:星火/斯卡拉拆分
rdd.map(_.split("-")).filter(row => { ... })
當我做row.length上:
這-is-a的試驗----上split--
這-is-a的測試-------
輸出是9個4個RE pectively。如果尾部分隔字符爲空,則不計算它們。如果我希望兩個輸出都是10,那麼這裏有什麼解決方法?
可以完成你想要什麼用-1作爲極限參數split
這樣的:
rdd.map(_.split("-", -1)).filter(row => { ... })
順便說一句,預期的結果是11,而不是10(因爲如果你想保持空令牌和你的字符串以分隔符結尾,然後解釋爲該分隔符後面有一個空的標記)。你可以看到this瞭解更多信息。