2017-01-23 50 views
0

我想知道是否有方法在文本文件中查找(並顯示)所有唯一字(出現一次的字)?這可以通過使用命令行來完成嗎?或者我會不得不使用類似python腳本的東西?文本文件中的唯一字

+0

你也可以試試這個[link](http://stackoverflow.com/questions/22978602/how-to-return-unique-words-from-the-text-file-using-python) –

回答

0

如果您不想編寫應用程序,那麼我可以想到的最簡單的方法就是使用powershell。看到這一點:

https://msdn.microsoft.com/en-us/powershell/reference/5.1/microsoft.powershell.utility/get-unique

Microsoft提供的例子填充一個變量的獨特單詞列表:

$A = $(foreach ($line in Get-Content C:\Test1\File1.txt) {$line.tolower().split(" ")}) | sort | Get-Unique 

你可能希望使用更多的分隔符,雖然拆就標點符號像這樣:

$A = $(foreach ($line in Get-Content C:\test.txt) {$line.tolower().split(" .,?!;:")}) | sort | Get-Unique 

將其放在一個擴展名爲.ps1的文件中,您可以從命令行運行它。爲了獲得這些值出的變量只是變量第二行以呼應結果到屏幕上:

$A 

爲了獲得項目的數組中的數,你可以這樣做:

$A.count 
+0

這工作完美!非常感謝! –

+0

沒問題。對於像這樣的簡單任務,PowerShell是完美的。拼湊一個小腳本比編寫需要編譯的應用程序要快。 – tonythewest

+0

有沒有辦法忽略標點符號? –

相關問題