我是Python新手,我已經發現這裏的帖子非常有幫助,但現在我被卡住了。我已經從電子郵件解析交易數據,並將其保存爲一個字符串對象,看起來像這樣:從多行字符串對象創建pd.dataframe
= E2 = 84 = 96 \ tOrderID \ tInstrument/ISIN \ tDirection \ tQuantity \ T = \ nPrice \ tAmount \ tDeal時間\ tSlppage \ t確認時間\ t = \ n結算時間\ tCommission \ t費用和費用\ t其他\ n> \ tPO59332737 \ tOil- 20Sep17 \ tBuy \ t100 \ t46.100000 \ t = \ n4610.00 USD \ t2017- 08-30 20:46:36 \ t0.000000 \ t2017-08-30 = \ n21:01:47 \ t2017-08-30 21:01:47 \ t0.000000 GBP \ t0.000000 GBP \ t = \ n \ n \ tPO59332799 \ tOil-20Sep17 \ tBuy \ t50 \ t46.100000 \ t = \ n2305.00 USD \ t2017-08-30 20:46:48 \ t0.000000 \ t2017-08- 30 = \ n21:01:47 \ t2017-08-30 21:01:47 \ t0.000000 GBP \ t0.000000 GBP \ t = \ n- \ n> \ tMO59332700 \ tOil-20Sep17 \ tBuy \ t100 \ t46.019000 \ t = \ n4601.90 USD \ t2017- 08-30 20:46:27 \ t0.000000 \ t2017-08-30 = \ n20:46:27 \ t2017-08-30 20:46:27 \ t0.000000 GBP \ t0.000000 GBP \ t = \ n \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n> \ n \ 。該片段顯示3行數據。 列以\ t分隔,電子郵件中的新行以\ n開頭。
我的目標是將此字符串轉換爲熊貓數據框對象,但我很努力。我試過用\ t和\ n替換爲;,然後將字符串保存爲StringIO對象,並使用pd.read_csv從字符串中創建數據框。但是,這會將所有數據放入單獨的列中,以便最終生成0行。
如何操縱字符串對象,以便pd.read_csv自動識別新行何時開始。在csv文件中,新行以新行開始,但是,在我的字符串中,所有行都連接在一起。
任何幫助將不勝感激。 謝謝。
編輯:我意識到字符串中的新行以\ n>開頭。我如何使用它來指定數據框中的新行何時應該啓動?
非常感謝代碼,特別是對於評論,所以我可以理解線條之間發生了什麼。已應用您的方法併成功創建了一個pd.dataframe對象。 – Simon
非常好。我很高興它有幫助。 –