我正在學習Hadoop和MapReduce框架。到現在爲止,我已經玩過文本文件並利用MapReduce框架進行處理。Hadoop和不同格式的輸入如圖像,音頻,視頻
當我啓動MapReduce學習第一個受歡迎的例子時,我發現它是WORDCOUNT這是一個文本文件處理場景。 然後我寫了自己的邏輯來處理一些文本文件並顯示結果。在這種情況下,我取得了成功。
但我需要移動到不同格式的輸入。因爲在現實世界中,我們不會僅處理文本文件。 我需要探索使用MapReduce框架處理不同格式的圖像,音頻,視頻等。 但我正在努力尋找適合我的目的的例子。我需要一些關於MapReduce的示例和教程,使用不同的輸入格式,從文本到視頻。
編輯:
我的意思是處理圖片,視頻和音頻。不僅是文本文件。
編輯2:
爲例: 說我具有10年.BMP圖像(其中,壓縮和解壓縮是不參與),其大小爲450GB的。我需要分析文件夾中的每個圖像,並且我應該顯示類似的圖像(通過比較像素的相似性圖案)。我應該列出在「從」「到」日期之間創建/修改的圖像。說在2013年1月至2013年2月之間在該組圖像中創建/修改的圖像。 我該如何做到這一點?
我會很高興,如果任何人幫助我在正確的道路上旅行!
好吧,我迷惑了你。對不起,我:()編輯了我的問題,再次查看一下,謝謝! – BinaryMee 2013-03-18 06:28:50
查看編輯答案 – Tucker 2013-03-18 06:36:19
我已經編輯過這個問題了 – BinaryMee 2013-03-18 06:44:58