我是熊貓新手,我試圖在Dataframe中加載csv。我的數據缺少代表的值? ,我試圖用標準的Missing值替換它 - NaN熊貓如何更換?與NaN - 處理非標準缺失值
請幫助我解決這個問題。我嘗試閱讀熊貓文檔,但我無法遵循。
def readData(filename):
DataLabels =["age", "workclass", "fnlwgt", "education", "education-num", "marital-status",
"occupation", "relationship", "race", "sex", "capital-gain",
"capital-loss", "hours-per-week", "native-country", "class"]
# ==== trying to replace ? with Nan using na_values
rawfile = pd.read_csv(filename, header=None, names=DataLabels, na_values=["?"])
age = rawfile["age"]
print age
print rawfile[25:40]
#========trying to replace ?
rawfile.replace("?", "NaN")
print rawfile[25:40]
不過令人驚訝的是參數'read_csv'沒有工作。當價值實際上是'我有一個看似失敗'? '我只是在標記'?'作爲NaN。 – cphlewis 2015-03-25 06:27:00
你在那個專欄或其他地方有'?'嗎? – EdChum 2015-03-25 08:49:28
奇怪的是,'read_csv'沒有選擇這個值,你可以發佈原始輸入數據來重現你的錯誤,它可能不僅僅是單個字符在該列 – EdChum 2015-03-25 08:51:09