級聯迭代

的我看到了「編程在斯卡拉」第24章「深度集合」這個例子。這個例子顯示了兩種可選的方式來實現一棵樹：級聯迭代

通過延長Traversable[Int] - 這裏的def foreach[U](f: Int => U): Unit複雜性將是O(N)。
通過延伸Iterable[Int] - 在這裏複雜的def iterator: Iterator[Int]將是O(N log(N))。

這是爲了證明爲什麼它會是有幫助的兩個獨立的特質，Traversable和Iterable。

sealed abstract class Tree 
    case class Branch(left: Tree, right: Tree) extends Tree 
    case class Node(elem: Int) extends Tree 

    sealed abstract class Tree extends Traversable[Int] { 
    def foreach[U](f: Int => U) = this match { 
    case Node(elem) => f(elem) 
    case Branch(l, r) => l foreach f; r foreach f 
    } 
    } 

    sealed abstract class Tree extends Iterable[Int] { 
    def iterator: Iterator[Int] = this match { 
     case Node(elem) => Iterator.single(elem) 
     case Branch(l, r) => l.iterator ++ r.iterator 
    } 
    }

關於foreach實施他們說：

遍歷平衡樹需要的時間與樹元素的數量。要看到這一點，考慮到對於平衡樹與N葉，你將有N - 1類Branch的內部節點。因此，遍歷樹的步驟總數爲N + N - 1。

這是有道理的。 :)

然而，他們提到在iterator方法的兩個迭代的級聯有時間的log(N)複雜，因此該方法的總的複雜性將是N log(N)：

元件被產生每次通過級聯迭代器（如 l.iterator ++ r.iterator），計算需要間接地沿着一個以得到右迭代器（l.iterator或 r.iterator）。總體而言，這使得log(N)間接尋找具有N片樹葉的平衡樹的葉子。因此，即使瀏覽樹中的所有元素的成本約2N的foreach遍歷方法走到N log(N)與iterator遍歷。

????

爲什麼的級聯迭代需要計算得到的左側或右側迭代器的葉子？

來源

2016-08-02 rapt

不知道我理解你的問題。連接的迭代器需要在每個**元素（葉）下面「獲取」**。任何特定的葉子將由'l.iterator'或'r.iterator'提供。如果樹是平衡的，那麼遍歷到樹葉的間接指向數就是樹的深度。因此，對於N個葉子，log（N）遍歷以獲得任何特定的葉子。 – jwvh

@jwvh更新了我的問題。正如你所看到的，'foreach'方法也會訪問每一片葉子。但總的複雜性只有O（N）。雖然'iterator'的複雜性是'O（N log（N））'。顯然，在'iterator'上應用'++'會增加複雜性。 – rapt

在此實現中，最頂端的分支不知道left和right子分支中有多少個元素。

因此，迭代器與鴻溝遞歸建成並征服的做法，是在iterator方法上清楚地表示 - 你到每一個節點（case Branch），你生產的單個節點case Node => ...的迭代器，然後你加入他們。如果不進入每個節點，它不知道有哪些元素以及樹是如何構造的（奇數分支允許而不允許等）。

編輯：讓我們來看看Iterator的++方法。

def ++[B >: A](that: => GenTraversableOnce[B]): Iterator[B] = new Iterator.JoinIterator(self, that)

，然後在Iterator.JoinIterator

private[scala] final class JoinIterator[+A](lhs: Iterator[A], that: => GenTraversableOnce[A]) extends Iterator[A] { 
    private[this] var state = 0 // 0: lhs not checked, 1: lhs has next, 2: switched to rhs 
    private[this] lazy val rhs: Iterator[A] = that.toIterator 
    def hasNext = state match { 
     case 0 => 
     if (lhs.hasNext) { 
      state = 1 
      true 
     } else { 
      state = 2 
      rhs.hasNext 
     } 
     case 1 => true 
     case _ => rhs.hasNext 
    } 
    def next() = state match { 
     case 0 => 
     if (lhs.hasNext) lhs.next() 
     else { 
      state = 2 
      rhs.next() 
     } 
     case 1 => 
     state = 0 
     lhs.next() 
     case _ => 
     rhs.next() 
    } 

    override def ++[B >: A](that: => GenTraversableOnce[B]) = 
     new ConcatIterator(this, Vector(() => that.toIterator)) 
    }

從此我們可以看出，加入迭代器只是會在rhs領域的遞歸結構。此外，讓我們更多地關注它。考慮具有結構的偶數樹level1 [A]; level2 [B][C]; level 3[D][E][F][F]

當您在迭代器上調用JoinIterator時，您將保留現有的lhs迭代器。然而，你總是.toIterator在rhs。這意味着對於每個後續級別，rhs部分將被重建。因此對於B ++ C，您會看到A.lhs (stands for B)和A.rhs (stands for C.toIterator)，其中C.toIterator代表C.lhs and C.rhs等。因此，增加了複雜性。

我希望這能回答你的問題。

來源

2016-08-02 07:24:05 sebszyller

我不認爲這回答了這個問題 - 當然每個節點至少應該達到一次 - 但是這會給O（N）的時間複雜性，正如他們在替代性的'Traversable [Int]'實現中所解釋的那樣。但是，一旦計算出兩個子分支，他們就會說在它們上應用'++'需要log（N）'操作（我不明白他們爲什麼這麼說）。所以'iterator'方法的總複雜度是N log（N）。這裏N是樹葉（節點）的數量，因此樹中的總元素是≈2N。 – rapt

因此，問題的結構不正確，因爲你知道爲什麼你必須訪問每個元素。您正在問時間複雜性。您應該更新原始問題，以免它再使人們感到困惑。 – sebszyller

我很抱歉誤會。我相信我問過爲什麼連接兩個迭代器會花費O（log（N）），而不是爲什麼產生它們。無論如何，我已經更新了我的問題。 – rapt

關於「收集深度」的雙關語是恰當的。數據結構的深度很重要。

當你調用top.iterator.next()，每個內部Branch委託給Branch或Node低於它，這是log(N)調用鏈的迭代器。

您在每個next()上產生該呼叫鏈。

使用foreach，您只需訪問Branch或Node一次。

編輯：不知道這是否有幫助，但這是一個熱切地尋找葉片但懶惰地產生值的例子。它會在舊版本的Scala中疊加或者更慢，但是鏈接++的實現得到了改進。現在它是一個扁平鏈，因爲它被消耗而變短。

sealed abstract class Tree extends Iterable[Int] { 
    def iterator: Iterator[Int] = { 
    def leafIterator(t: Tree): List[Iterator[Int]] = t match { 
     case Node(_) => t.iterator :: Nil 
     case Branch(left, right) => leafIterator(left) ::: leafIterator(right) 
    } 
    this match { 
     case n @ Node(_) => Iterator.fill(1)(n.value) 
     case Branch(left @ Node(_), right @ Node(_)) => left.iterator ++ right.iterator 
     case b @ Branch(_, _) => 
     leafIterator(b).foldLeft(Iterator[Int]())((all, it) => all ++ it) 
    } 
    } 
} 

case class Branch(left: Tree, right: Tree) extends Tree { 
    override def toString = s"Branch($left, $right)" 
} 
case class Node(elem: Int) extends Tree { 
    def value = { 
    Console println "An expensive leaf calculation" 
    elem 
    } 
    override def toString = s"Node($elem)" 
} 

object Test extends App { 
    // many leaves 
    val n = 1024 * 1024 
    val ns: List[Tree] = (1 to n).map(Node(_)).toList 
    var b = ns 
    while (b.size > 1) { 
    b = b.grouped(2).map { case left :: right :: Nil => Branch(left, right) }.toList 
    } 
    Console println s"Head: ${b.head.iterator.take(3).toList}" 
}

來源

2016-08-02 09:01:57

在我引用的代碼中，你看到對'iterator.next（）'的調用？ – rapt

「每次一個元素由一個連接的迭代器產生」是另一種說「下一個」的方式。也許你的短語「連接迭代器的計算」意味着你只考慮構建迭代器（它只會熱切地走向左邊緣，因爲'++'帶有一個名稱參數。我認爲「訪問所有元素」也意味着「產生所有的值」，通過迭代它們 –

你是說當Iterator.next（）在樹的迭代器被創建的時候被調用（即當Iterator。++（...）被調用時）嗎？看起來像Tree.foreach（...）和Tree.iterator（）具有相同的複雜度，O（2N）= O（N），你是否同意這一點？ – rapt

回答

相關問題