2013-10-08 35 views
0

您好,我有一個hadoop集羣,我想在R中編寫我自己的Mapper和Reducer,然後使用Hadoop Streaming做一些時間序列分析。Hadoop安裝R

但是,我想知道在羣集中安裝任何類型軟件的「常用」方式是什麼。

可能存在某種魔力,如:

sudo hadoop install R? # Pseudo code 

謝謝!

回答

1

其實我與Linux的最終期望自動執行此安裝。

#!/usr/bin/expect -f 

if {[llength $argv] != 1} { 
puts "usage: ssh.exp server" 
exit 1 
} 

set server [lrange $argv 0 0] 
set timeout 60 

spawn ssh -i key.pem [email protected]$server 

expect "*connecting (yes/no)*" 
send -- "yes\r" 

expect "*~]$*" 

send -- "sudo su -c 'rpm -Uvh http://dl.fedoraproject.org/pub/epel/6/i386/epel-release-6-8.noarch.rpm'\r" 

send -- "nohup sudo su -c 'yum install -y R R-core R-core-devel R-devel' &\r" 

expect "*~]$*" 
send -- "exit\r" 

interact 
0

使用自動化工具(如PuppetChef)在整個羣集中自動執行安裝過程。

此外,周邊還有像Revolution AnalyticsRhipe的一個R一些包裝,使其更易於編寫MR方案R.