在CDH的NameNode中,當我通過odbc腳本(php/perl或python)運行查詢時,我可以獲取所有結果(9.2M)在一個變量中大約30秒,但是當我用相同的腳本/查詢試圖另一個遠程2級的服務器上時,執行時間是在第一服務器28分鐘和在第二17分鐘。Impala ODBC/JDBC性能不佳 - 與NN相比,遠程服務器的行提取速度很慢
要排除的假設,這是一個網絡速度問題,我獲取結果上的一個文件,然後我跟scp命令複製到第一個遠程服務器,並完成了〜40秒。
我在查詢信息觀察什麼在CM中存在的線程之間有很大的不同:網絡發送等待時間值在3個查詢:
在NN查詢 :9.40s
在第一個遠程服務器:16.7米
在第二個遠程服務器:26.8米
而且我也嘗試用黑斑羚JDBC的Java腳本,但在NN的結果已經不能刺激繼續。
但到目前爲止,我無法找到問題出在哪裏,我該如何解決它。
NB:我正在使用CDH 5.12.0/Impala 2.9.0,我安裝了Impala ODBC 2.5.37.1014。
我會測試這個。 –
我無法在我的centos 6.9中安裝hive-jdbc。 它給:沒有包hive-jdbc可用。 Rmq:我不認爲我對參考文獻#1和#2感到擔憂,因爲我的查詢沒有錯誤地被執行。問題在於,在外部羣集服務器上,所有行在速度上都很慢。 –
更新了答案。調查是關於延遲,日誌可能會顯示需要花費的時間。 – Marco99