我正在使用Kaggle提供的泰坦尼克號數據集。我有一個數據框,我想改變「性」列的情況下小寫。我使用下面的代碼 import pandas as pd
df = pd.read_csv('titanic.csv')
print dfFull['sex'].unique()
df.sex.str.lower()
#check if it worked
print df['sex'].un
我擁有列表形式的數據。我想做一些像(data[1::100])[3]這樣的事情,在那裏我訪問前100個元素,然後是所有元素的第三列。在上Kaggle教程,我看到了之類的東西data[1::100,3],但是Python說: TypeError: list indices must be integers, not tuple. 是否有一個簡單的方法來做到這一點?我可以使用一個循環或其他東西,但是這
我有一個機器學習算法,它涉及一系列步驟,例如清理數據,準備訓練數據等。每個步驟都存儲在python類的單獨方法中。我想知道構建我的類的最佳實踐方式是如何在類實例化時自動執行這些步驟。 這是我所做的(代碼是說明性的,但這種方法適用於真正的算法)。它感覺有點笨重。有沒有更優雅的方式? class Kaggle():
"""
An algorithm
"""
d