2013-04-25 73 views
0

我想加入GeoIP數據庫的日誌條目。這是我的。MapReduce內部加入?

  1. 在我的日誌文件中,我將IP地址(外鍵)提取爲鍵。並將其作爲一個值休息。

  2. 在GeoIP數據庫中我有一個IP地圖範圍到特定的國家(IPFROM,IPTO,國家)。

現在我不確定如何去加入這兩個字段,以及要使用哪個連接。

回答

1

如果我理解正確,你想得到一個給定的IP地址日誌文件的國家名稱。

您可以通過導出數據庫表來創建一些csv。

然後您可以使用分佈式緩存概念來讀取該文件

+0

同意這一點。但那麼如何將國家與IP映射爲GeoIP擁有一系列IP地圖到一個國家? – Ananda 2013-04-25 06:17:22

+0

請從日誌文件 – 2013-04-25 11:27:28

+0

發佈數據庫的一個樣本記錄和一個樣本行是固定長度的ip範圍嗎? – 2013-04-25 12:31:42