假設我有以下pyspark數據框:過濾pyspark數據幀,以保持至少含有1空值(守,不降)行
>>> df = spark.createDataFrame([('A', 'Amsterdam', 3.4), ('B', 'London', None), ('C', None, None), ('D', None, 11.1)], ['c1', 'c2', 'c3'])
>>> df.show()
+---+---------+----+
| c1| c2| c3|
+---+---------+----+
| A|Amsterdam| 3.4|
| B| London|null|
| C| null|null|
| D| null|11.1|
+---+---------+----+
我怎麼能現在選擇或任何行篩選,含至少一個空值,像這樣?:
>>> df.SOME-COMMAND-HERE.show()
+---+---------+----+
| c1| c2| c3|
+---+---------+----+
| B| London|null|
| C| null|null|
| D| null|11.1|
+---+---------+----+
的可能的複製[如何過濾掉火花數據框中空值(http://stackoverflow.com/questions/39727742/how-to-filter-out -a-null-value-from-spark-dataframe) –
不,這不是一回事。在那裏,他們想要**過濾掉任何包含空值**的特定列的行**。在這裏我想**過濾**任何包含**至少一個**空值的行。 –