weka

    0熱度

    1回答

    我使用weka(在java中)構建了一個隨機森林分類器。 我將一個序列化的分類器保存到磁盤。但是,序列化文件太大(大約100 MB)。此外,如果我對更多的實例進行了訓練,文件變得越來越大,所以我猜測序列化模型也會保存數據。 還有另一種方法來保存weka分類器嗎?而對於較小的輸出文件(通常我認爲大小應該僅取決於模型架構)。 我用下面來serilization,所有產生相同的文件大小: Weka.co

    0熱度

    1回答

    我使用Weka的JAVA API根據不同的文本特徵對文檔進行分類。當使用TextDirectoryLoader類時,我可以加載一個包含某些文本的txt文件的目錄,將文本轉換爲數字特徵並在以後對實例進行分類。問題在於,該文本將由數據集中的單個字符串要素表示。 例如: TextDirectoryLoader loader = new TextDirectoryLoader(); loader.set

    1熱度

    1回答

    我試圖使用Java的Weka API導入一個ARFF文件,但它給我一個錯誤時: DataSource source = new DataSource("C:/Users/user/Documenti/file.arff"); Instances dataset = source.getDataSet(); java.io.IOException: unparseable date: 2014

    0熱度

    1回答

    我想將WEKA 3.6.10版中的SMOTE過濾器應用於數據集,但Apply按鈕處於禁用狀態。輸入文件格式爲.arff,第一列表示標稱值。還有其他過濾器無法應用,例如Resample過濾器,SpreadSubsample過濾器等。最後一個版本的WEKA工具甚至不包括SMOTE過濾器。 我想知道是否有數據集的問題與輸入。輸入數據應該如何才能被SMOTE過濾器考慮? WEKA軟件的最新版本甚至沒有包含

    1熱度

    1回答

    我有一個包含10000條記錄的大型數據集,其中5000個屬於類1,其餘5000個屬於類-1。我使用隨機森林,並獲得了超過90%的良好準確性。 現在,如果我有一個ARFF文件 @relation cds_orf @attribute start numeric @attribute end numeric @attribute score numeric @attribute

    0熱度

    1回答

    我必須將少數類測量的分類精度(A),精度(P)和回調(R)合併爲一個測量值M:M = w1 * A + w2 * P + W3 * R其中w1,w2和w3分別是A,R和P的權重因子。 我不確定此線性模型公式的權重因子是多少? 非常感謝您的幫助!

    0熱度

    1回答

    我已經使用Weka GUI來訓練和測試一個文件(做出預測),但是不能對API執行相同的操作。我得到的錯誤表示列車和測試文件中有不同數量的屬性。在GUI中,這可以通過檢查「輸出預測」來解決。 如何使用API​​做類似的事情?你知道那裏有什麼樣嗎? import weka.classifiers.bayes.NaiveBayes; import weka.classifiers.meta.Filte

    1熱度

    1回答

    我嘗試使用J48算法對Weka中的10 iris.arff數據集運行簡單的分類。我使用了10倍的交叉驗證,並且 - 如果我沒有錯 - J48的所有默認設置。 結果是6個錯誤分類實例的準確率達到96%。 這裏是我的問題:根據this樹可視化中的第二個數字是每個葉子中錯誤分類實例的數量,但是爲什麼它們的總和不是6而是3? 編輯:運行用不同的測試選項算法我獲得在準確度方面不同的結果(因此錯誤的數量),但

    3熱度

    4回答

    我創建了一個小的ruby腳本來調整圖像大小並將它們保存在指定的目錄中。我希望應用程序儘可能透明。 是否有可能允許文件在所有平臺上拖放到我的Ruby腳本?例如,用戶拖動文件到腳本,然後取文件的路徑作爲參數,並相應地調整圖像大小 - 沒有GUI,沒有控制檯等。

    0熱度

    1回答

    當從WEKA調用分層聚類(我使用C#中的IKVM,但我不認爲它很重要,答案可以用任一種語言)時,有一個選項可以生成Newick格式的樹形圖,但是當試圖解析它時,我需要識別葉子並將每個葉子的假連接到輸入中的一個數據(矢量)。 例如,輸入ARFF是: @RELATION points @ATTRIBUTE x REAL @ATTRIBUTE y REAL @DATA 1.0,2.0 3