2010-03-02 60 views
9

幾個月前我學會了Hadoop,併成功地做了一個非常簡單的編程項目。我想用Hadoop做一箇中小型項目或一系列小型編程任務。我已經看到很多想法,但是我沒有看到任何可以在大約60-70小時的工作中完成的事情,所以這是一個非常小規模的項目,因爲我在業餘時間和其他研究中都想做這件事。我所看到的大部分項目構想都會持續2-3個月。本練習的主要目標是在Hadoop環境編程中培養良好的專業知識,而不是進行任何研究或解決特定問題。我發現Hadoop被大量的web服務所使用,也許這對於小型項目來說是一個有趣的軌道。使用Hadoop MapReduce的項目構想

預先感謝您。

問候, 阿迪亞

回答

1

我最近遇到的Cloud9 MapReduce library通過UMD開發出來。從你以前的關於NLP的問題來看,我認爲這可能對你有用。

頁面底部有一些練習可能會爲您提供一個開始的地方。

對於使用MapReduce的,你可以看看它的作者林志穎鏈接到這本書草案文本處理的一些信息:

Data-Intensive Text Processing with MapReduce

+0

這「CLOUD9的MapReduce庫」鏈接無法正常工作。如果可能,請更改鏈接。 – Azim 2016-09-03 19:24:33