0
我正在清洗熊貓中的大型數據文件。一列('ID')包含字符串和整數的組合。如果某個特定ID的記錄不止一個,用戶慣例就是追加'*'(星號)和序列號。使用正則表達式在熊貓中擦除字符串
我需要向DF('CleanID')添加一列,並複製該ID,或者對於包含星號的任何ID去掉'*'加上所有後續字符。所以:
ID CleanID
A1000*1 A1000
A1000*2 A1000
B200 B200
457 457
等