我有兩個數據庫(txt文件)。一個是兩列,製表符分隔的名稱和ID。自定義格式ID映射
name1 \t ID1
name1 \t ID2
name2 \t ID9
name2 \t ID40
name3 \t ID3
其他數據庫具有相同的ID作爲第一列第一位的,而第二列列出用逗號分隔的同種(這是在第一個的那些子女的標識,如第二個數據庫是分層的)。
ID1 \t ID1,ID2,ID3
ID2 \t ID2, ID9
我想這樣做的就是用相同的格式第二第三數據庫,但在第二列,我想給孩子們的ID換出的第一個數據庫的名稱。例如:
ID1 \t name1,name2,name3
ID2 \t name1,name2
有沒有辦法做到這一點?我是初學者,當我在使用Web服務之前必須映射ID時,但這是進一步分析所需的自定義格式,我不確定從哪裏開始。
在此先感謝!
Databases = tables?桌子平面文件? –
是的,他們是簡單的txt文件,對不起,如果我不清楚。 –
這可能太籠統了,特別是在python,r和bash中標記問題。 – dayne