data-partitioning

2熱度

1回答

我已經實現了一個基準測試10個不同表上的讀寫操作的持久性。我有10個Java線程，每個僅在其表進行查詢：線程上表1 1名執行操作，線程2個上表2執行操作，我已經司儀運行那些線程的性能並行地執行對非分區表[1-10]的多次讀取，同時將每個TableX劃分爲9個相等的分區（每個表示一週的測量，總共9周的數據）。我收到有趣的和不可解釋的結果：單一操作的單個線程的性能是一個非分區表高2倍，而所

0熱度

1回答

在python中展開數據並行循環，必須在MPI環境下工作

我需要執行一個for循環，該循環作用於許多數據點，每個數據點獨立於任何其他數據點。在範圍X（1,10000000） some_procedure（X），我需要使其運行速度更快，通過利用數據並行，但我有MPI工作。我正在使用mpi4py，但對此我完全陌生。哪一個理論上在選項a和b之間理論上工作得更快，以及爲什麼： a。在foo.py： from mpi4py import MPI send

0熱度

1回答

如何將增量編號添加到分組系列中的每個元素？

我面臨一個問題，我有一個名爲Group的表格和一個名爲Entry的表格。 Group表具有主鍵Id。 Entry表具有主鍵Id，Group表的Id的外鍵被稱爲GroupId。 Entry表還有一列Weight。這Weight是一個整數，它所做的就是告訴我排序權重，其中0顯示在頂部。基本上發生的是，有人在設計數據庫時使這個Weight字段爲空。現在我需要通過並調整Weight以適應我們打算添加的U

0熱度

1回答

按列分組數據

我有一個50行和1.5M列的大矩陣。從這150M欄中，前兩個是我的標題。我想把我的數據按列分成小塊。因此，例如每個小組將是50行和100列。但是每個小數據都必須將上面提到的前兩列作爲標題。我試圖 awk '{print $1"\t"$2"\t"}' test | cut -f 3-10 awk '{print $1"\t"$2"\t"}' test | cut -f 11-20 ...

0熱度

1回答

全局索引，同時更名爲分區名

我有它的一些索引的現有的表。我將使用dbms重定義來對該表進行分區。我還必須每隔24小時重命名分區名稱。重命名分區名稱後，全局索引中是否存在任何問題？請回復。是否必須有一個主鍵來執行間隔分區？我使用Oracle 11g

2熱度

1回答

使用多個HTTP requsets獲取通過parllel任務的數據檢索部分內容

我試圖像徹底的，因爲我可以在這個崗位，因爲這對我來說非常重要，雖然這個問題很簡單，只有通過閱讀這個問題的標題，你可以得到的想法...... 的問題是：與健康的帶寬（30MB VDSL）提供... 如何爲單個數據/文件獲得多個httpWebRequest？，所以每個reaquest，將下載只有數據的一部分然後當所有實例已完成，所有的部件連接回單件。代碼： ...我已經走到這一步工作是一樣的

2熱度

1回答

分區VS多個多維數據集性能

鑑於這種情況，三個國家銷售信息。 CountryA: 0.9M records. CountryB: 0.8M records. CountryC: 0.7M records. 從理論上講，這將是預期的性能差異（*）以下方法之間？單個多維數據集，每個國家/地區有一個分區。三個立方體，每個國家一個。（*）對於單個國家查詢，偏離課程。

0熱度

1回答

在SQL Server 2008中使用索引表的分區切換進行並行批量加載

這是繼我的previous question後確定分區切換作爲快速獲取數據到大量索引的事實類型表中的最佳方式，該表需要保持對讀者可用。雖然它似乎是最好的方法，但它還不足以真正滿足允許多個（< 5）用戶同時批量插入，並將新數據編入索引並出現在索引視圖（不一定是真正的索引視圖，只是依賴索引的選擇）。分區的想法是，以分區爲根的每個分區和索引子樹可以並行鎖定爲只讀，複製到工作表中，插入/更新新數據並重

8熱度

2回答

分割一個浮動數組相似片段（聚類）

我有浮標一個這樣的數組： [1.91, 2.87, 3.61, 10.91, 11.91, 12.82, 100.73, 100.71, 101.89, 200] 現在，我想到陣列這樣劃分： [[1.91, 2.87, 3.61] , [10.91, 11.91, 12.82] , [100.73, 100.71, 101.89] , [200]] // [ 200]將被視爲異常值，因爲較

1熱度

1回答

MATLAB - cvpartition的「k」和「kfold」分區類型之間的區別

有人可以請我解釋使用分層10倍交叉驗證程序（如'k'分區所表示的區別數據和它對分區數據的影響類型）或10倍交叉驗證程序（如「kfold」分區類型所示）我的意圖是使用此分區爲使用自舉集成的時間序列分析執行交叉驗證過程。情況下，哪種分區類型將是首選分區我的解釋變量儘可能最好地適合我的響應變量？任何幫助表示讚賞。謝謝