我想將grep和停用詞文件一起使用,以從另一個文件中過濾掉常見的英語單詞。文件「somefile」每行包含一個字。使用grep從停用詞文件中過濾掉單詞
cat somefile | grep -v -f stopwords
這種方法的問題是:它檢查在停用詞一個詞是否在somefile發生,但我想如果somefile一個詞停用詞出現相反的情況,即檢查。
如何做到這一點?
例
somefile包含以下內容:
hello
o
orange
禁用詞包含以下內容:
o
我想從somefile過濾出個 「o」,而不是你好,橙子。
或'grep -v -w -f stopwords somefile'避免了'cat'命令 – Matthias
我根據你的清理建議改變了答案@Matthias –