我正在嘗試通過熊貓數據框上收集的評論列表,並標記這些單詞並將這些單詞放入數據框的新列中,但運行時出現錯誤通過這個,是將單詞轉化爲熊貓數據框中的新列
的錯誤,指出AttributeError的:「統一」對象有沒有屬性「apwords」
是否有任何其他方式做到這一點?由於
def apwords(words):
filtered_sentence = []
words = word_tokenize(words)
for w in words:
filtered_sentence.append(w)
return filtered_sentence
addwords = lambda x: x.apwords()
df['words'] = df['complaint'].apply(addwords)
print df
我試圖做什麼你和若昂·阿爾梅達建議,但我得到一個類型錯誤:預期字符串或現在緩衝區,是因爲像你說什麼,我必須定義一個繼承自字符串的類並執行我的原始方法?謝謝 – user3655574
不,它必須意味着在你的'df''怨聲'中''你有別的東西比字符串。如果你使用'df.dtypes',你必須在'抱怨'前面有'object'類型嗎?我認爲,最有可能的是你缺少值(不是字符串),然後在應用'addwords'類型'df ['complaints'] = df ['complaints']。fillna('')'' nan'值由空字符串。 – ysearka