使用位移除10？

是否有可能通過使用純位移，加法，減法和也許乘以10來除無符號整數？使用資源非常有限且分割緩慢的處理器。使用位移除10？

2011-04-05 Thomas O

有可能（重複減法是除法），但問題是它是否比慢速除法更快。 – 2011-04-05 21:07:29

@esnyder。對不起，我無法理解你。你在基地17還是基地22說話？ – 2011-04-05 21:39:39

基地大二。如果用「10」表示16位十進制或10h，則右移除2^n即可解決您的問題。 – tamarintech 2011-04-05 21:42:14

這裏的編制小整型常量部門當微軟編譯器做什麼。假設一個32位機（代碼可相應調整）：

int32_t div10(int32_t dividend) 
{ 
    int64_t invDivisor = 0x1999999A; 
    return (int32_t) ((invDivisor * dividend) >> 32); 
}

這是怎麼回事這裏要說的是，我們要按照1/10 * 2^32基本接近倍增，然後除去2^32。這種方法可以適應不同的除數和不同的位寬。

這對於ia32體系結構非常適用，因爲它的IMUL指令會將64位產品放入edx：eax中，並且edx值將成爲所需的值。即一個緩慢的乘法指令（假設股息是EAX和商通過在EAX返回）

div10 proc 
    mov edx,1999999Ah ; load 1/10 * 2^32 
    imul eax    ; edx:eax = dividend/10 * 2 ^32 
    mov eax,edx   ; eax = dividend/10 
    ret 
    endp

即使一臺機器上，這將是比軟件更快地劃分。

來源

2011-04-05 21:14:32

+10

+1，我想強調一下，編譯器會自動爲你寫這個「x/10」 – Theran 2011-04-05 21:25:35

.hmm，這裏沒有一些數值不準確嗎？ – 2011-04-06 12:49:47

做整數除法時，你總是會有數字不準確：當你用整數除以28時，你會得到什麼？答：2。 – 2011-04-06 12:52:57

除法是減法，所以是的。向右移1（除以2）。現在從結果中減去5，計算你減法的次數，直到值小於5.結果是你做的減法的次數。哦，劃分可能會更快。

如果分頻器中的邏輯尚未爲您完成這項工作，那麼採用正常分頻將右移再除以5的混合策略可能會使您獲得性能提升。

來源

2011-04-05 21:12:46 tvanfosson

當然，你可以，如果你能承受一些精度上的損失。如果你知道你的輸入值的值範圍，你可以提出一個位移和一個精確的乘法。一些例子，你可以如何劃分10，60，...像這樣的博客描述格式time the fastest way可能。

temp = (ms * 205) >> 11; // 205/2048 is nearly the same as /10

你的，阿洛伊斯·克勞斯

來源

2011-04-05 21:12:48

您必須意識到中間值'（ms * 205）'可能溢出。 – 2011-04-05 21:16:04

如果你做int ms = 205 *（i >> 11）;如果數字很小，您將得到錯誤的值。您需要一個測試套件來確保在給定的值範圍內結果是正確的。 – 2011-04-05 21:28:29

這對於ms = 0..1028 – 2014-10-18 01:14:49

儘管到目前爲止給出的答案與實際問題相符，但它們與標題不匹配。所以這裏的解決方案深受Hacker's Delight的啓發，它確實只使用了位移。

unsigned divu10(unsigned n) { 
    unsigned q, r; 
    q = (n >> 1) + (n >> 2); 
    q = q + (q >> 4); 
    q = q + (q >> 8); 
    q = q + (q >> 16); 
    q = q >> 3; 
    r = n - (((q << 2) + q) << 1); 
    return q + (r > 9); 
}

我認爲這是缺乏乘法指令的架構的最佳解決方案。

來源

2013-09-29 08:56:52 realtime

在一次只能移動一個地方的體系結構上，一系列明顯的比較兩個乘以10的權力可能比黑客的解決方案更好。假設一個16位的分紅：

uint16_t div10(uint16_t dividend) { 
    uint16_t quotient = 0; 
    #define div10_step(n) \ 
    do { if (dividend >= (n*10)) { quotient += n; dividend -= n*10; } } while (0) 
    div10_step(0x1000); 
    div10_step(0x0800); 
    div10_step(0x0400); 
    div10_step(0x0200); 
    div10_step(0x0100); 
    div10_step(0x0080); 
    div10_step(0x0040); 
    div10_step(0x0020); 
    div10_step(0x0010); 
    div10_step(0x0008); 
    div10_step(0x0004); 
    div10_step(0x0002); 
    div10_step(0x0001); 
    #undef div10_step 
    if (dividend >= 5) ++quotient; // round the result (optional) 
    return quotient; 
}

來源

2015-12-14 19:51:28

您的代碼執行16乘法10.爲什麼您認爲您的代碼比黑客的快樂更快？ – chmike 2017-10-07 20:11:46

我的想法並不重要。重要的是在適用的平臺上它是否更快。試試吧！這裏根本沒有普遍最快的解決方案。每個解決方案都有一個平臺，並且在該平臺上工作得最好，可能比任何其他解決方案都要好。 – 2017-10-18 16:09:45

我沒有注意到n * 10是恆定的。它將由編譯器預先計算。我在答案中提供了一種替代算法。除了一個區別之外，我們的算法是等價的您從v中減去b * 10並將其添加到x * 10中。您的算法不需要跟蹤保存變量的x * 10。您顯示的代碼展開我的while循環。 – chmike 2017-10-18 19:10:26

考慮到庫巴奧伯的迴應，還有一個在同一脈絡。它使用迭代逼近的結果，但我不希望有任何令人驚訝的表現。

假設我們必須找到x其中x = v/10。

我們將使用逆操作v = x * 10，因爲它具有很好的屬性，當x = a + b，然後x * 10 = a * 10 + b * 10。

讓我們使用x作爲迄今爲止保持最佳結果近似值的變量。搜索結束後，x將保留結果。我們將x的每個位b從最高有效位設置爲較低有效位，逐個比較(x + b) * 10與v。如果其小於或等於v，則位b設置在x中。爲了測試下一個位，我們只需將b一個位置向右移（除以二）。

通過在其他變量中保存x * 10和b * 10，我們可以避免乘以10。

我們得到以下算法通過10

uin16_t x = 0, x10 = 0, b = 0x1000, b10 = 0xA000; 
while (b != 0) { 
    uint16_t t = x10 + b10; 
    if (t <= v) { 
     x10 = t; 
     x |= b; 
    } 
    b10 >>= 1; 
    b >>= 1; 
} 
// x = v/10

編輯來劃分v：獲得庫巴奧伯的算法，避免了變量x10的需要，我們可以減去vb10和v10。在這種情況下x10不再需要。該算法變得

uin16_t x = 0, b = 0x1000, b10 = 0xA000; 
while (b != 0) { 
    if (b10 <= v) { 
     v -= b10; 
     x |= b; 
    } 
    b10 >>= 1; 
    b >>= 1; 
} 
// x = v/10

環路可以unwinded和b和b10的不同值可以預先計算爲常數。

來源

2017-10-18 18:53:46 chmike

使用位移除10？

回答

相關問題