0
我有一個巨大的靜態數據集,我有一個函數可以應用到它。 f是形式reduce(map(f,dataset)),所以我會使用MapReduce骨架。但是,我不想在每次請求時分散數據(理想情況下,我想利用索引來加速f)。有一個MapReduce實現來解決這個一般情況?當處理查詢流到同一個數據集時的高效MapReduce
我已經採取了看看IterativeMapReduce,也許它的工作,但似乎爲解決一個稍微不同的情況下,代碼還不可用。