打印圖像文件的路徑

我發現一個有趣的problem據說在Google面試中被問到，我很好奇它的解決方案。這個問題陳述很長並且有一點點抽象，所以我只在這裏包括它的摘錄（完整的問題在上面的鏈接中）：打印圖像文件的路徑

給你一個文件中的目錄和文件的列表系統。每個目錄和文件都有一個名稱，該名稱是由字母數字字符組成的非空字符串。此外，每個文件的名稱都包含一個點號字符;名稱以點開頭的部分稱爲擴展名。目錄名稱不包含任何點。所有的名字都是這種情況 - 敏感。每個條目在一個單獨的行中列出。每個目錄後面跟着一個空格字符的內容列表。根目錄的內容不縮進。

文件系統列表的格式似乎是this。本質上，目標似乎是搜索輸入文件，並將絕對路徑的總長度（以字符爲單位）以模1,000,000,007爲單位返回到所有直接包含至少一個圖像文件的目錄。由於文件系統本質上是樹，我正在考慮將輸入文件讀入解析它的函數，並創建類似B-Tree的東西（因爲每個目錄可以有不同數量的子目錄/文件）。然後，您可以對樹進行深度遍歷來查找帶有圖像擴展名的文件，然後打印它們的路徑。但是，使用B/B +樹更適合在數據庫中維護排序索引，而在這裏，文件不一定需要排序。對帖子的一些評論（來自第一個鏈接）提供了不會在輸入文件中創建樹的解決方案，但是由於該問題指出預期O（N）時間和空間複雜性，似乎構建樹只會有所幫助。

所以這裏的問題是：

如果樹是在這種情況下使用，這將是樹的最佳類型以及它將如何解決問題幫助？
如果不應該使用樹，那麼更有效的替代方法是什麼？

來源

2016-09-06 loremIpsum1771

樹會是O（N log N），不是？ – jxh

@jxh你的意思是深度優先搜索需要多少時間？那不是O（n）嗎？ – loremIpsum1771

樹插入是O（log N）。你這樣做了N次。 – jxh

如果目標是O（n），那麼您應該考慮在數據的一次傳遞中解決問題的方式。

您的建議方法是O（n＆middot; log（n）），因爲您需要時間在隨後的傳遞之前創建B樹以查找包含圖像的目錄。

由於輸入似乎已經像樹一樣排列，所以您可以直接利用它。不要構建自己的樹，只需跟蹤處理輸入時所需的信息。當你到達輸入結尾時，你應該有你的答案。

我想到的算法是在遞歸函數中處理每個目錄。離開函數時，如果遇到圖像文件，請將路徑長度添加到累加器。如果遇到沒有點的文件名，則深入該函數。當您遇到縮進級別低於應該出現的級別時返回。

以下算法假定leading_spaces(EmptyLine)結果爲負值。

process_directory(in path, in level, in-out accum) 
    has_image = false 
    while get_line(line) 
    invariant leading_spaces(line) <= level 
    if leading_spaces(line) < level 
     return line 
    while no_dot(line) 
     line = process_directory(path + '/' + trim(line), level + 1, accum) 
     if leading_spaces(line) < level 
     if has_image 
      accum = accum + length(path) 
     return line 
    has_image = extention_is_image(line) 
    if has_image 
    accum = accum + length(path) 
    return EmptyLine

來源

2016-09-06 22:49:58 jxh

感謝您的回答，並對已故的回覆感到抱歉。這周我很忙。在這個實現中我不確定的一件事就是爲什麼你要通過文件遞歸。您有一個while循環迭代地獲取文件的每一行，並且文件本身在單獨的一行中具有每個（樹的節點）目錄或文件。你不僅僅需要檢查每個子目錄或文件之前的製表符數量嗎？ – loremIpsum1771

@ loremIpsum1771我想你正在問一個不同的問題。遞歸是爲了使路徑名稱管理更簡單。當遞歸調用返回時，路徑變量真正反映到當前目錄的路徑。如果你解析縮進的每一行，你必須解析你的路徑字符串，找出如果你最終跳出子目錄，會剝離多少。 – jxh

打印圖像文件的路徑

回答

相關問題