2017-10-20 108 views
0

我的Hadoop 2.8.1如何將文件從本地筆記本電腦放到遠程HDFS?

可配置HDFS-site.xml中

<configuration> 
# Add the following inside the configuration tag 
<property> 
     <name>dfs.data.dir</name> 
     <value>/app/dfs/name/data</value> 
     <final>true</final> 
</property> 
<property> 
     <name>dfs.name.dir</name> 
     <value>/app/dfs/name</value> 
     <final>true</final> 
</property> 
<property> 
     <name>dfs.replication</name> 
     <value>1</value> 
</property> 
<property> 
    <name>dfs.webhdfs.enabled</name> 
    <value>true</value> 
</property> 
</configuration> 

難道被Python發現這個代碼

from pywebhdfs.webhdfs import PyWebHdfsClient 
from pprint import pprint 

hdfs = PyWebHdfsClient(host='hadoop01',port='50070', user_name='hadoop') # your Namenode IP & username here 

my_data = "01010101010101010101010101010101000111 Example DataSet" 
my_file = '/examples/myfile.txt' 
hdfs.create_file(my_file, my_data.encode('utf-8')) 

這個變種工作。 但我想把已經準備好的文件放到遠程HDFS上。

試圖寫

with open("C:\\Downloads\\Demographic_Statistics_By_Zip_Code.csv") as file_data: 
    print(file_data) 

但文件並沒有投入到HDFS。 只返回

<_io.TextIOWrapper name='C:\\Downloads\\Demographic_Statistics_By_Zip_Code.csv' mode='r' encoding='cp1251'> 

如何解決這種情況?

回答

相關問題