有一些過濾器的功能是這樣的:如何在不同的pyspark腳本中共享相同的廣播變量包含的過濾器函數?
def filter1(x):
if broadcast_variable1.value[x] > 1:
return False
return True
def filter2(x):
if broadcast_variable2.value[x] < 1:
error_accumulator_variable.add(1)
return False
return True
這些功能都包含在我的主要pyspark腳本。現在我想將它們分成一個模塊文件以便於維護(我有兩個用於不同用途的pyspark腳本,但它們具有相同的過濾器),然後將其餘文件保存在不同的文件中。
如何在不同的pyspark腳本中共享這些類似的過濾功能?
感謝您的慷慨幫助