2010-04-23 44 views
2

國家公園管理局的自然聲音程序每年都會收集數TB的數據以測量音景。在你看來,什麼是最好的腳本語言來管理大量的文件和文件類型?我們希望輕鬆設計和運行高效的用戶友好腳本,以根據單個靜態層次結構搜索和檢索/創建可能位於不同目錄中的文件的副本。操作系統很可能是windows。謝謝!用於編寫大規模文件管理腳本的最佳語言

+0

什麼操作系統?微軟的Windows和Unix上的變種,或者z/OS都可能有所不同。 – 2010-05-17 21:30:46

回答

4

使用你的開發者最熟悉的那個。您從中獲得的生產力收益幾乎肯定會擊敗一種語言可能對另一種語言產生的優勢。

+1

+1與你所知道的去。它經常運作得最好。 – 2010-04-23 21:29:02

0

我真的不知道你會用腳本語言去尋找什麼,但是Eric是正確的,你應該使用你的開發人員熟悉的東西。但是,如果您還沒有開發人員,並且從頭開始設計項目(和團隊),則可以使用C++或.Net(C#或VB)。

雖然C++提供更強大的編程和性能,但C#和VB.Net提供更快的生產。無論.Net的生產優勢如何,我都會認爲對於大量文件類型的文件,您將從C++中獲得最好的整體滿意度。在我看來,除了單擊按鈕或從列表中選擇選項之外,最好的用戶友好設計只需要很少的用戶輸入。

2

使用Python。這很容易學習。每個人都可以輕鬆轉換

當您搜索目錄或在文件外搜索元數據時,文件的大小並不重要。即便如此,您很少需要讀取整個聲音樣本文件以去除元數據。

另外,如果你這樣做頻繁,你可能要考慮

  1. 提取所有元數據到關係數據庫。

  2. 將關係數據庫用作聲音示例文件的複雜「索引」。

每個文件添加或更改將通過同步與數據庫更新文件的更改,以確保數據庫索引文件系統實際上是相匹配的應用程序來完成。

大部分搜索可能成爲SQL查詢。

+0

我也是爲了類似的問題去使用python,但是用於存檔Terabyte的DNA測序數據。我實際上在Perl中編寫了第一個原型,但是當腳本的複雜性增加時,我需要轉向一些OO(面向對象)和DDD(域驅動設計)模式以使其健壯,而且perl中的OO並不是很好,而在Python中它是非常好的。另外,也許最重要的是,python的更清晰的語法,結合DDD原則,例如「用您的名字記錄您的函數」,使得腳本遠遠超過我在Perl中完成的可讀性。 – 2011-09-10 10:15:46