partitioning

    3熱度

    3回答

    我需要一種算法,將n數字分區生成k部分,並附加限制條件,即分區的每個元素必須介於a和b之間。理想情況下,滿足限制條件的所有可能的分區應該是同等可能的如果分區按照不同的順序具有相同的元素,則認爲它們是相同的。 例如,對於n=10,k=3,a=2,b=4一個僅具有{4,4,2}和{4,3,3}作爲可能的結果。 是否有這樣一個問題的標準算法?可以假定至少有一個滿足限制條件的分區總是存在。

    1熱度

    1回答

    我有一張非常大的表,我想從中刪除舊行。表的例子: | customer_id | first_purchase_date | last_purchase_date | |<primary key>| | <index> | **我使用這個示例表爲參數的緣故。有問題的表不是客戶表。真正的桌子在過去的2個月裏已經增長到28GB,用於計算僅需要2周曆史數據的東西。 我想要做的就是從該

    2熱度

    1回答

    使用數據庫postgresql 9.5。 我有一個表employee_shift與行,所以要提高插入我分區此表上月爲20年(2000年1月至2020年12月,即到目前爲止240個分區表)。這是一個column日期在桌子裏。現在,我的插入速度更快(通過本機查詢完成),但我現有的DAO層使用的HQL命中employee_shift表而不是命中employee_shift_2010_10(year_mo

    0熱度

    1回答

    我有大量來自源的數據,每個記錄都有一個維度dim1。 Dim1可以有多達一百萬個唯一值。其中一些將有大量的數據,有些則會少一些。對於例如Dim1value1可能有100K條記錄,Dim1value2可能有100萬條記錄,Dim1value3可能有10條記錄等等。 現在我想將它們分組到一定程度相等的分區,以便與每個DIM1數據進入一個組,我要創建約20幾分等於組。 基本上每個記錄具有Dim1Valu

    0熱度

    1回答

    我需要比較Hadoop和Oracle的分區。在類似於Oracle的動態分區和Bucketing方面,我可以在Hadoop中找到類似的Partitioning類型,例如List Partitioning和Hash Partitioning。 有什麼方法可以在Hadoop/Hive中創建範圍分區?

    -1熱度

    1回答

    我的印象是,在/dev下列出了一個塊設備,例如/dev/xvdf,並且文件系統位於分區所在的塊設備後面所列的分區上,如/dev/xvdf1,並且所有文件系統都必須住在一個分區上。 我正在運行CentOS,並且作爲課程的一部分,我必須創建文件系統,分區和安裝文件系統。在本課程中,我已經在設備文件/ dev/xvdf上創建了一個文件系統,並且已經安裝了該文件系統。除此之外,我還在/ dev/xvdf上

    1熱度

    1回答

    我們使用Informatica進行ETL,數據庫是Oracle 11g。 我們有一個每天加載的事實表(20億條記錄)。這個事實表有大約44個索引,事實表是分區的。 我們正在按照以下流程進行增量加載。 確定要從臨時表中加載的分區。通常將有大約750K - 900K記錄3到4個分區 創建一個臨時表,做事實表的分區的分區交換 填充從分段表中的增量數據到臨時表 再次做一個交換分區的事實表臨時表 重建周圍8

    -1熱度

    1回答

    我在分區表上創建了一個視圖。當我將分區列傳遞給SELECT語句時,優化程序在通過EXPLAIN語句檢查時不會訪問該特定分區。 有什麼辦法讓視圖訪問它的表的單個分區? [編輯]:這是我如何創建兩個分區表 CREATE TABLE Partition1 (ID INT,NAME VARCHAR(100),DOB DATE) PARTITION BY LIST (YEAR(DOB)) ( P

    0熱度

    1回答

    我想在卡桑德拉設計一些列家族,但我對主/分區鍵有一些懷疑。 我想是這樣的: 數據分佈均勻集羣 周圍最小化分區的讀取數量 我知道,這些目標是可以實現的,通過選擇合適的分區/主鍵,但是假設選擇的分區/主鍵允許在你的colum-family中有無效的數據,你會怎麼做? 假設我有以下科拉姆-FAMILY: CREATE TABLE group ( groupname text, user

    2熱度

    2回答

    我使用的是這樣檢查的整數範圍分區的表(T1): CONSTRAINT t1_201611_check CHECK (date_id >= 20161101 AND date_id <= 20161130) CONSTRAINT t1_201612_check CHECK (date_id >= 20161201 AND date_id <= 20161231) 等.. 它工作正常,並在搜索正