2017-09-02 57 views
-1

我想知道是否可以使用機器學習來檢查數字的可分性。 例如,假設我想檢查可被11和13整除的數字。 我可以創建一個1-500的數字數據集,如果它們可以被11整除,那麼給它們一個1的標籤,如果它們可以被整除,則爲2 13和0,如果它們不能被任何一個整除。使用機器學習檢查可分性

以下是我所面臨的問題:

  1. 與數字1-500標籤0顯然將成爲占主導地位的標籤,導致偏

  2. 即使我保持均衡的數據集含等於所有標籤的行,當我在1-1000上應用算法時,較低範圍數字變爲0作爲標籤,中間數字爲1並且較高範圍數字爲2.

想知道我該怎麼做才能訓練我的機器?我是否添加新功能?如果是的話,那有什麼特點? 此外,如果有任何ML算法中,你認爲會工作,請建議(已經嘗試過KNN,決策樹,SVM,Naive_Bayes)

編輯:我知道這是不適用ML問題,但我的教授給我這個任務。我想知道是否有可能。

+2

'eg'是'exempli gratia'的縮寫,意思是'例如'拉丁文。因此'例如'意味着'例如,'它是沒有意義的。只是說'eg'或'例如' –

+4

這是一個古典的「我不知道我在做什麼,但神經網絡應該是很酷」。真。查找數字的可分性是處理器的一個或兩個基本數學運算。在這個問題上拋出一個DNN是沒有理解DNN做什麼的標誌。事實上,你不能讓線性算子給你一個線性運算意味着你甚至沒有試圖看看數學。 –

+0

這是應用ML算法的一個非常奇怪的選擇。幾乎所有的ML分類器都會在這裏變得很糟糕(線性分類器會失敗),而它被大多數語言(包括用於模塊化算術的Pythons'%'操作符)內置。你能增加動力嗎?如果是關於學習ML如何工作的問題,那麼在這裏你並沒有增加太多,你不能通過學習XOR來增加。 –

回答

0

看起來主要的問題是編碼整數 - 當然使用整數本身沒有任何意義,所以你需要適當地編碼它們。

如果考慮二進制的整數(從某個範圍),它們自然屬於適當的向量空間,機器學習算法假定輸入是這樣的向量。

一些老師在機器學習中使用類似的玩具問題,例如Hinton的課程中的17th slide from this pdf