算法發現長度爲3

串的最頻繁出現的序列「鑑於多個名稱陣列，發現長度爲3（長度爲3的序列）的名字出現頻率最高的序列，如果存在」算法發現長度爲3

例如：鑑於3個數組：

Ana John Maria 
Paul 
Sharon Ana John Maria Tiffany Ted

的輸出將是Ana John Maria因爲該序列中遇到兩次，在第一和第三陣列。

我似乎無法找到正確的解決方案。

任何人都可以指向正確的方向嗎？也許這是一個衆所周知的算法。任何人都可以給我一個鏈接？謝謝

來源

2012-08-15 Dan Dinu

您可以計算每個單詞，然後比較計數。不是最優雅的解決方案，但可能是最簡單的解決方案。 – Hassan 2012-08-15 16:55:33

@oleksii它是一個長度爲3的序列3 – 2012-08-15 16:58:51

它是一個具有3個名稱（-sequences）的數組還是3個數組，每個數組都有幾個名稱？ – aefxx 2012-08-15 17:00:43

將數組合併到類似於trie的樹中，其中每個節點不是單個字母，而是整個名稱。這應該允許您更容易地查找和計數子序列。事實上，我強烈懷疑這個任務有一個標準算法，您可以查看它。

更新：看看使用後綴樹算法：http://en.wikipedia.org/wiki/Suffix_tree

來源

2012-08-15 16:55:08 Marcin

一個簡單的方法是採取3個序列，並把它們放在一個HashTable。一旦遇到3的序列，你就增加相應的發生計數器。最後只需返回最常見的事件/序列。通過掃描HashTable找到具有最大出現值的條目，可以找到這個結果。 Java中的示例：

public class Sequence { 
    public List<String> sequenceOfThree(List<List<String>> names){ 
      Map<List<String>, Integer> map = new HashMap<List<String>, Integer>(); 
      for(List<String> nameList:names){ 
       int startIdx = 0; 
       int endIdx = 3; 
       while(endIdx <= nameList.size()){ 
        List<String> subsequence = nameList.subList(startIdx, endIdx); 
        //add to map 
        Integer count = map.get(subsequence); 
        if(count == null){ 
         count = 0; 
        } 
        map.put(subsequence, count + 1); 
        startIdx++; 
        endIdx++; 
       } 
      } 
      Integer max = Integer.MIN_VALUE; 
      List<String> result = Collections.emptyList(); 
      for(Entry<List<String>, Integer> entries:map.entrySet()){ 
       if(entries.getValue() > max){ 
        max = entries.getValue(); 
        result = entries.getKey(); 
      } 
     } 
     return result; 
    } 
    /** 
    * @param args 
    */ 
    public static void main(String[] args) { 
     List<List<String>> names = new ArrayList<List<String>>(); 
     names.add(Arrays.asList(new String[]{"Ana", "John", "Maria"})); 
     names.add(Arrays.asList(new String[]{"Paul"})); 
     names.add(Arrays.asList(new String[] 
"Sharon", "Ana", "John", "Maria", "Tiffany" ,"Ted"})); 
     System.out.println(new Sequence().sequenceOfThree(names)); 
    } 
}

來源

2012-08-15 18:17:51 Cratylus

由於某種原因，縮進被搞砸了 – Cratylus 2012-08-15 18:18:18

雖然這會起作用，但隨着輸入變大，時間會變長。 – Marcin 2012-08-15 21:34:14

它是'O（MN）'，其中'M'是列表的數量，'N'是列表的大小 – Cratylus 2012-08-15 21:53:55

算法發現長度爲3

回答

相關問題