Can Lua可以與Hadoop對話嗎？

我可以使用Lua編程語言爲Hadoop？Can Lua可以與Hadoop對話嗎？

如果是這樣，怎麼樣？

來源

2011-05-23 JacobR

我從來沒有使用Lua的，也不是的Hadoop流側 - 所以這僅僅是一個建議，不知道這是否會工作：

在http://www.michael-noll.com/tutorials/writing-an-hadoop-mapreduce-program-in-python/看一看，使用Python的Lua的就地？

如果我要嘗試做你的要求，那將是我的出發點。

來源

2011-05-24 13:57:56 Nija

絕對:)你可以使用Hadoop的流媒體這樣的：

創建映射器和/或減速的Lua腳本，從標準輸入讀取：

#!/usr/bin/env lua 
while true do 
    local line = io.read() 
    if line == nil then break end 

    # Do something with the incoming row 

end

，然後運行您的工作，如：

$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ 
    -input myInputDirs \ 
    -output myOutputDir \ 
    -mapper myMapper.lua \ 
    -reducer myReducer.lua \ 
    -file /local/path/to/myMapper.lua 
    -file /local/path/to/myReducer.lua

在這裏，您使用-mapper和-reducer指定您的映射器和reducer腳本，並將這兩個腳本與-file您的分佈式緩存，所有任務跟蹤器都可以訪問它。

當流運行，你需要確保lua適用於所有運行任務服務器的機器。

前一段時間，我們嘗試使用luajit（這是可怕的快）從豬流。如果您使用的豬，你可以這樣做：

OP = stream IP through `/local/path/to/script`;

這是不一樣的使用Lua作爲一個映射或減速，但根據您的操作情況，請從映射器或減速機的輸出通過流劇本。

來源

2011-05-26 07:14:46 xinit

Can Lua可以與Hadoop對話嗎？

回答

相關問題