2015-12-15 78 views

回答

1

如果您在UNIX,下面應該這樣做

strings sqllite.txt | grep '\"http[^\"]*"' | tr '"' '\n' | grep 'http' | sort | uniq > extracted_urls.txt 

哪裏sqllite是數據庫文件。剛剛在RHEL上進行了測試。排序和uniq只是刪除重複的URL。

編輯:新的表達方式忽略網站圖標文件

strings sqllite.txt | grep '\"url\":\"http[^\"]*"' | tr ',' '\n' | grep '\"url\":\"http' | tr '"' '\n' | grep 'http' | sort | uniq > extracted_urls.txt 
+0

我在Windows英寸但是這可以在Cygwin上工作嗎? – rudolph

+0

@rudolphd我這麼認爲,但我現在無法測試它。如果失敗,可能需要進行語法調整。 –

+0

剛剛測試過,它沒有工作,運行後沒有任何顯示。我檢查了文件夾,它是正確的,因爲它不顯示「沒有這樣的文件或目錄」。 – rudolph