2010-08-23 44 views
2

我需要測試一些製圖類。對於這些我想創建一個1-2百萬數據的大數據集!我如何創建這樣的大數據集?如何創建用於測試目的的大數據集?

謝謝

+0

爲什麼downvote?它足夠清楚。 – Nobody 2010-08-23 14:53:52

+0

什麼樣的數據?隨機數字? DVD電影選擇歷史加權?高地?什麼是範圍?類型? – 2010-08-23 14:53:54

+0

對不起我的不確定的問題。不知道該怎麼說,但我需要數據集,這些數據集一直在變化。在極端情況下,第二個200萬數據。我的製圖班必須實時繪製這些數據。有了這個數據集,我想測試現有的圖表類。不知道它的可能性,但那是我的使命:) – h0ppel 2010-08-23 16:59:22

回答

0

複製任何現有的數據並將其粘貼數百萬次。

1

這個問題有點太開放了,但總之你可以創建一個程序來產生隨機數據。基本上對於每個數據字段,選擇一個數據範圍(EG:0 - 100,「true」/「false」等)。然後讓你的程序用隨機數據填充每個字段。寫這一領域的數據集,並重覆上述過程上百萬次......

0
for(i = 1; i <= 2000000; i++) { 
    insertRandomData(); 
} 
0

任何文字,你可以使用這可能是你的種子,也許只是把它作爲一個字符串,然後將它分割成一個字符串數組並開始組合數組的隨機索引,而數字只是使用隨機功能。這裏是你的種子:

Lorem ipsum dolor sit amet,consectetur adipiscing elit。 Fusce scelerisque nulla congue felis interdum nec lobortis turpis blandit。 Ut sagittis molestie lacinia。 Phasellus iaculis justo vel ligula vestibulum pretium。非洲鰻n。 Curabitur eu ipsum dignissim eros volutpat dignissim。 Maecenas lobortis ultricies nisl,sit amet laoreet leo tristique eget。 Donec ullamcorper,metus condimentum vehicula mollis,urna lorem tincidunt arcu,eget rutrum nisl enim sit amet enim。 Aliquam ac mi tellus。 Nullam簡歷在posuere arcu的justo lacus。 Aliquam fermentum lacus eu urna爭論pellentesque。 Nam malesuada tincidunt odio,eget adipiscing libero pulvinar sit amet。 Ut risus dolor,不可限制的調味品,convallis vitae elit。 Aliquam ultricies consequat nulla eget convallis。 Maecenas eget sollicitudin neque。 Etiam aliquam商業sagittis。 Morbi pellentesque metus ut eros euismod ullamcorper。

0

利用現有數據集,如Stackoverflow用戶數據。

0

我的項目http://fluentetl.codeplex.com/可能會幫助你。

您可以很容易地使用它來將測試數據轉儲到您的數據庫中,實際上在示例中對此進行了說明。

一個示例通過代碼生成數據。另一個示例連接2個文本文件,名字列表和姓氏列表,並將所有可能的組合插入到表格中。您可以將自己的隨機數據循環保存到數據庫中。

相關問題