2017-09-13 84 views
0
X = df1.iloc[:, 1:].values 
y = df1.iloc[:, 0].values 

from sklearn.cross_validation import train_test_split 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25,  random_state=0) 

from sklearn.neighbors import KNeighborsClassifier 
knn = KNeighborsClassifier(n_neighbors=3, metric='minkowski', p=2) 
knn.fit(X_train, y_train) 

ValueError: could not convert string to float: '2/1/2011' 

我打算使用這些功能製作投注模型。 FTR =全職結果:(H)OME,(d)原料,(A)的方式主隊的 odds_H =賠率如何在我的算法上使用我的日期特徵?

+0

什麼是屬性 –

+0

你可以用文本格式而不是「PNG」來獲得你的'df',以便其他人可以使用這些數據來模擬你的問題嗎?您可以簡單地複製/粘貼數據並將其標記爲代碼或Blockquote。 –

回答

0

在ML,有如果您將日期作爲功能,則可以執行相當多的操作。已經在過去是有用的變換的一些例子:

  • 天數,月數,年數,季度數
  • 工作日
  • 季節(如春天= 0,夏天= 1 ... )
  • year_day號(1月= 0,31月= 364)
  • 天數自/一些事件(在你的例子之前,這可能因爲以前的比賽是天數)
  • 而很多更多...

有一些警告,但一般來說,它應該很容易從一個datetime對象到這些表示(作爲整數)的每個表示。取決於您的特定數據集,其中一些可能非常有用。

相關問題