我最近在我的Java編程類中接收了一個任務,用於分析一個(我猜測這是一個非常小的)數據集。我非常喜歡賦值和使用'tokenizer'等,這對我來說是一個新概念。我們得到的數據集非常無聊,因爲它只包含日期。公共數據集「練習」
我正在尋找的是:
公共數據集(XML,TXT或類似)到
這可能是什麼真正的(最好是很簡單的)實踐的分析,因爲我主要是想打印出統計數據,模式和圖表。
我最近在我的Java編程類中接收了一個任務,用於分析一個(我猜測這是一個非常小的)數據集。我非常喜歡賦值和使用'tokenizer'等,這對我來說是一個新概念。我們得到的數據集非常無聊,因爲它只包含日期。公共數據集「練習」
我正在尋找的是:
公共數據集(XML,TXT或類似)到
這可能是什麼真正的(最好是很簡單的)實踐的分析,因爲我主要是想打印出統計數據,模式和圖表。
嘗試使用Stackoverflow data dump。
除了nos提到的原始數據轉儲之外,請參見其夥伴Stack Exchange Data Explorer。在那裏,您可以運行SQL查詢並下載結果集。 (有用的,如果你正在尋找一些小於一切。)
UC Irvine Machine Learning Repository是這種事情的一個很好的資源。