large-data-volumes

    0熱度

    2回答

    我有一個我想要使用CUDA呈現的大型數據集。數據集的大小約爲5GB。它採用8位原始格式。有沒有辦法將數據集壓縮到小於3 GB的大小? 質量損失/細節對我來說很好。減少的數據集也應該是8位原始格式。

    1熱度

    1回答

    在我的WPF應用程序中,我有一個帶有選項卡控件的屏幕。其中五個選項卡包含需要顯示大量行(至少5000)的數據網格。這些表綁定到Part對象的ObservableCollections。每行顯示約20個零件數據。我的問題是,在用戶輸入他們需要的信息並生成數據後,單擊選項卡會導致應用程序掛起30-60秒。在這之後,datagrid最終加載,並且具有正確的虛擬化設置,它們以可接受的速率執行(不是很快,但

    2熱度

    2回答

    我正在尋找如何有效地查詢大量數據的好資源。 每個數據項表示爲許多不同的屬性,如數量,價格,歷史信息等。客戶端將提供不同的查詢條件,但不需要更改數據集。通過簡單地將所有數據存儲到MS中,SQL並不是一種好的方法b/c MS SQL的可擴展性並不好。在這裏,我們針對許多tera字節數據,需要200-300個CPU羣集。 我對良好的資源或書籍感興趣,至少我可以做一些研究。

    0熱度

    1回答

    我提前道歉這不是一個特定的編程問題,但我相信這是這項調查的最佳場所。 基本上,我有什麼,我認爲是一個有趣的社交網站(不只是現存事物的克隆,但一些有用的和獨特的)的想法;我有詳細的說明文件描述了一切如何工作,但我不知道如何從這裏繼續下去。在結構上,好像這將是最相似的東西,如Twitter,和我有什麼技術都參與了這一(SQL數據庫,AJAX,移動集成等)的一些想法。我沒有時間自己編寫所有的代碼,老實說

    6熱度

    1回答

    我是apache solr用戶,大約一年。我用solr進行簡單的搜索工具,但現在我想用5TB數據的solr。當我根據我使用的過濾器進行索引時,我假設5TB數據將爲7TB。然後我將每小時添加近50MB的數據到同一個索引。 1-使用單個solr服務器和5TB數據有什麼問題。 (無碎片) A-能SOLR服務器響應在可接受的時間 B-什麼是對7TB指數50MB數據的commiting預期的時間查詢。 c-

    0熱度

    1回答

    我有一個大的ArrayCollection,需要在Datagrid的系列中顯示。 經過測試,加載時間約爲30秒-1分鐘。 我的問題在這裏,有沒有辦法逐步添加每個數據網格並顯示它,而不是等到所有數據網格完全創建? 現有: 的AddChild 1 的AddChild 2 的AddChild 3 重複直到的AddChild-X CreationComplete 我的意過程: 的AddChild 1個 C

    0熱度

    1回答

    我正在使用MySQL(Windows)中的maxmind geocities表(see here)。 這張表有超過270萬行(非常大)。 我試圖找到城市重複(爲了找到像北京(北京),北京每個城市不同的拼寫...)跟隨它們的經度和緯度。 即使我使用左外連接,子請求或複合where子句,但響應時間過長(它永遠不會結束)。 這是我最後一次嘗試: select * from cities c1, cit

    2熱度

    2回答

    我們有一個查詢將按月執行並返回大小爲1GB的數據。 此處使用的查詢只是包含內部連接的選擇查詢,不涉及遊標。 目前他們正在Toad中執行此查詢並將數據從輸出窗口導出爲.dat文件。 請注意,使用蟾蜍手動操作需要2小時。 之後,他們正在更改.dat文件中的標題文本,使其具有有意義的名稱與我們的客戶共享。 我想通過創建一個將執行此過程的exe來自動執行此過程。 代碼快照看起來像下面 using (Ora

    0熱度

    4回答

    我有一個問題,我試圖從我的WCF服務傳輸大量的對象。我必須將對象的傳輸限制爲100,否則會出現某種通信錯誤。 我嘗試瞭解決方案中的建議,發現here,但也許我錯過了一些東西,因爲我仍然收到錯誤。 這裏是我的WCF服務的web.config文件的底部: <system.web> <httpRuntime maxRequestLength="102400" /> <compilat

    1熱度

    1回答

    我有一個MEMORY MYSQL數據庫,其中包含一個200k +行的表。我使用這個數據庫來測試交易策略,所以反覆查詢它是一種令人厭惡的行爲。沒有新的數據被添加到數據庫。 此數據庫主表中的一列是「時間」。在每個查詢中,我的存儲過程選擇「時間」最多在查詢輸入「時間」之前2小時或之後2小時的那些行。 由於我的數據庫中的數據具有5分鐘的分辨率,因此總計有288個可能的「當日時間」(24 * 60/5 =