2013-04-22 44 views
8

我需要一些人工數據,即機器學習中的「雙螺旋」,「羣集內羣集」,「半內核」,「月牙滿月」和「異常值」目的。在MATLAB中創建人工數據

Artificial Data

是否有MATLAB任何導/包/源代碼?

+1

您是否有全尺寸的數據樣本圖片?然後你可以'imread'每一個圖像,循環它'x'和'y'座標,並通過顏色閾值分離claster中的點。 – 2013-04-22 13:10:27

+1

如果你可以用一個函數定義一些形狀(對於圓等等),那麼你可以使用這個解決方案中的monte-carlo方法:http://stackoverflow.com/questions/16098209/point-cloud-generation/16098613#16098613 – Dan 2013-04-22 13:37:57

+0

如何使用imread將不同分組中的點分開? – BlueBit 2013-04-22 15:33:51

回答

12

因爲我認爲這將是非常有用的,這些可用的一種數據集,也因爲這將是一個有趣的練習,我寫了一些功能來生成非常類似於您的圖片中顯示的那些隨機數據集。有很多選項可以控制實例數量,噪聲量等。每個函數的輸出都是一個Nx3矩陣,其中每行包含X,Y座標和一個實例的類別。

這是輸出的樣子:

Example of generated datasets

我在每個30-40線6個腳本做到了。我將這些腳本上傳到Matlab文件交換中,但尚未審查。目前,您可以獲取文件here。在第一個版本中幾乎沒有任何評論,但我希望代碼是不言自明的。還有一個演示腳本(datasetsdemo.m),它將運行所有腳本並生成上面顯示的圖像。