Sparklyr拆分字符串

2017-06-22 55 views 0 likes

我有一個包含多行的文件。例如Sparklyr拆分字符串

A    B  C  
awer.ttp.net Code 554 
abcd.ttp.net Code 747 
asdf.ttp.net Part 554 
xyz.ttp.net  Part 747

我想用sparklyr庫語句，分割表只列A作爲R火花作出命令，我想一個新行添加到表d，其值AWER，ABCD， asdf和xyz。

我已經試過

data_2 %>% sdf_mutate(node2=ft_regex_tokenizer(data_2, input.col = "A", output.col = "D", pattern="[.]")) %>% sdf_register("mutated")

然後我嘗試的eval

mut_trial %>% mutate(E=D[[1]])

錯誤（表達式，ENVIR，enclos）：對象 'D' 未找到。

我不知道我是否以正確的方式做這件事，但想看看是否有任何其他功能使用，或者如果有一種方法來解決這個功能做我想做的事情。

來源

2017-06-22 Ark

回答

的代碼是在斯卡拉火花希望你的想法，並將其轉換在SparkR

import spark.implicits._ 
val data = spark.sparkContext.parallelize(Seq(
    ("awer.ttp.net","Code", 554), 
    ("abcd.ttp.net","Code", 747), 
    ("asdf.ttp.net","Part", 554), 
    ("xyz.ttp.net","Part", 747) 
)).toDF("A","B","C") 

data.withColumn("D", split($"A", "\\.")(0)).show(false)

輸出：

+------------+----+---+----+ 
|A   |B |C |D | 
+------------+----+---+----+ 
|awer.ttp.net|Code|554|awer| 
|abcd.ttp.net|Code|747|abcd| 
|asdf.ttp.net|Part|554|asdf| 
|xyz.ttp.net |Part|747|xyz | 
+------------+----+---+----+

希望這有助於！

來源

2017-06-22 05:46:01

相關問題

1. Elisp拆分字符串函數來拆分字符串。字符
2. C＃拆分字符串 - 將字符串拆分爲數組
3. 拆分字符串在字
4. 將字符串拆分爲字符串
5. 將字符串拆分爲字符串
6. 從字符串拆分字符串
7. PHP拆分字符串
8. Python字符串拆分
9. Python字符串拆分
10. ArrayIndexOutOfBoundsException在拆分字符串
11. 拆分後的字符串
12. 提升拆分字符串
13. 如何拆分字符串？
14. Cocoa-Touch字符串拆分
15. 拆分字符串在python
16. PHP拆分字符串
17. Python的字符串拆分
18. 字符串拆分問題
19. 如何拆分字符串？
20. 拆分一個字符串
21. Python字符串拆分
22. 將字符串拆分爲「|」
23. 拆分字符串值c＃
24. PHP - 拆分字符串
25. 拆分字符串數組
26. 字符串拆分比較
27. .NET字符串拆分（）
28. MySQL字符串拆分
29. 拆分基於字符串
30. SparkSQL拆分字符串