2016-06-14 107 views
0

我正在尋找使用WEKA來訓練和預測MongoDB中的數據。具體來說,我打算使用Weka API分析數據(例如構建推薦引擎)。但我不知道如何繼續,因爲MongoDB中的數據以BSON格式存儲,而WEKA使用ARFF格式。我想使用WEKA API從MongoDB讀取數據,進行分析,並向用戶提供實時推薦。我無法在WEKA和MongoDB之間找到橋樑。如何使Weka API與MongoDB一起使用?

這是甚至可能或者我應該嘗試另一種方法?

+0

此鏈接顯示了一個以編程方式定義自己的.arff文件的好例子。 https://weka.wikispaces.com/Programmatic+Use – Walter

+0

您是否考慮過使用mongodb jdbc或odbc驅動程序從weka訪問MongoDB數據? – user6641561

回答

0

在開始之前,我應該說WEKA並不是處理大數據的最佳工具。如果您確實擁有大數據,您可能會希望使用Spark和Hadoop系列,因爲它們更適合分析。

要回答你寫的問題,我會建議手動進行培訓(即使用任何可用的編程工具創建培訓文件)並預訓練模型。這些模型可以保存並相應地集成到一個程序中。

要進行測試,您可以按照official instructions進行測試,但我通常會採用一些快捷方式:我通常會將數據預處理爲類似CSV的格式(就好像它正在進入ARFF文件一樣) ARFF標題(與培訓文件使用的標題相同)。從那裏開始,測試實例非常簡單。根據我的經驗,這極大地簡化了編寫實際進行新穎預測的代碼的過程。

+0

非常感謝您的幫助!我想像你的想法一樣使用Weka。但我會努力學習Spark!如果是更好的選擇,我會把它帶入我的項目! 非常感謝! :) – Duong

相關問題