我正在與大學項目的Amazons MapReduce Web服務合作。爲了使用MapReduce的數據,我需要將它們從關係數據庫(AWS RDS)轉儲到S3中。在MapReduce完成之後,我需要拆分輸出文件並將其加載到它們自己的S3存儲桶中。如何爲AWS準備和善後數據MapReduce
在亞馬遜網絡服務環境中這樣做的好方法是什麼?
最好的情況:除了用於RDS和MapReduce的實例之外,是否可以在不使用額外的EC2實例的情況下完成此操作?
我使用python作爲MapReduce作業流程的mapper和reducer函數和json說明符。否則,我不是語言或技術的約束。
boto看起來很不錯,但不幸的是,你不能定義一個自定義的主要類的jar步驟,這使得我使用它是非常不切實際的。 – Thomas 2011-01-24 15:46:09