我有一個數據幀,其中有20列左右的列。其中一列稱爲'director_name',並具有諸如'John Doe'或'Jane Doe'等值。我想把它分成兩列,'First_Name'和'Last_Name'。當我運行以下它能正常工作並拆分字符串轉換成2列:將函數添加到熊貓中的字符串拆分命令中
data[['First_Name', 'Last_Name']] = data.director_name.str.split(' ', expand
= True)
data
First_Name Last_Name
John Doe
它的偉大工程,但它不,當我有下「director_name」 NULL(NAN)值工作。它引發以下錯誤:
'Columns must be same length as key'
我想補充哪些檢查功能,如果值= null,則做上面列出的命令,否則輸入「NA」將First_Name爲和「姓氏」
!任何想法我會怎麼做?
編輯:
我剛纔檢查的文件,我不知道,如果是空的問題。我有一些3-4個字符串的名字。即
John Allen Doe
John Allen Doe Jr
也許我不能把它分成First_Name和Last_Name。
Hmmmm
這對我的作品。你使用的是什麼版本的熊貓/蟒蛇? –
Python 3,Pandas 0.20.1。它有效,當你有空值?我認爲這就是爲什麼我的錯誤顯示。也許是其他原因?文件有5k條記錄,當我做.head(10)和所有值都有效時,當我打開它的整個文件(在'director_name'中有NULL值)它不是 – JD2775
錯誤是因爲某些字段將有不止一個空間,我已經更新了您的上一個問題的答案,以處理那個 – Vaishali