2016-09-21 84 views
1

這無疑是一個「看不見樹木」時刻。我一直盯着這個代碼一個小時,看不到我做錯了什麼。我知道它正在盯着我,但我看不到它!在Pandas數據框中使用pyproj投影之間的轉換

我試圖在使用Python的兩個地理座標系之間進行轉換。

我有經度(x軸)和緯度(y軸)的值和要轉換爲OSGB 1936對於單個點,我可以執行以下操作:

import numpy as np 
import pandas as pd 
import shapefile 
import pyproj 

inProj = pyproj.Proj(init='epsg:4326') 
outProj = pyproj.Proj(init='epsg:27700') 

x1,y1 = (-2.772048, 53.364265) 

x2,y2 = pyproj.transform(inProj,outProj,x1,y1) 

print(x1,y1) 
print(x2,y2) 

這將產生以下:

-2.772048 53.364265 
348721.01039783185 385543.95241055806 

這似乎是合理的,並建議的-2.772048經度被轉換爲348721.0103978的座標。

實際上,我想在熊貓數據框中做到這一點。數據框包含包含經度和緯度的列,我想添加兩個包含轉換座標(稱爲newLong和newLat)的附加列。

的典範據幀可能是:

latitude longitude 
0 53.364265 -2.772048 
1 53.632481 -2.816242 
2 53.644596 -2.970592 

而且我寫的代碼是:

import numpy as np 
import pandas as pd 
import shapefile 
import pyproj 

inProj = pyproj.Proj(init='epsg:4326') 
outProj = pyproj.Proj(init='epsg:27700') 

df = pd.DataFrame({'longitude':[-2.772048,-2.816242,-2.970592],'latitude':[53.364265,53.632481,53.644596]}) 

def convertCoords(row): 
    x2,y2 = pyproj.transform(inProj,outProj,row['longitude'],row['latitude']) 
    return pd.Series({'newLong':x2,'newLat':y2}) 

df[['newLong','newLat']] = df.apply(convertCoords,axis=1) 

print(df) 

主要生產:

latitude longitude  newLong   newLat 
0 53.364265 -2.772048 385543.952411 348721.010398 
1 53.632481 -2.816242 415416.003113 346121.990302 
2 53.644596 -2.970592 416892.024217 335933.971216 

但現在看來,NEWLONG和newLat值混淆了(與上面顯示的單點轉換的結果相比)。

我在哪裏劃過電線來產生這個結果? (我很抱歉,如果它是完全明顯的!)

回答

3

當你做df[['newLong','newLat']] = df.apply(convertCoords,axis=1),你正在索引df.apply輸出的列。但是,列順序是任意的,因爲你的系列是用字典定義的(這本質上是無序的)。

您可以選擇與固定的列排序返回系列:

return pd.Series([x2, y2]) 

另外,如果你想保持convertCoords輸出標記,那麼你可以使用.join到結果,而不是合併:

return pd.Series({'newLong':x2,'newLat':y2}) 
... 
df = df.join(df.apply(convertCoords, axis=1)) 
+0

非常感謝您提供的答案和即時解決方案。 – user1718097