2010-06-30 62 views
2

我期待優化使用SED或類似的Linux應用程序的英語單詞表一。爲了做到這一點,我需要:如何優化詞表的英語

刪除含有任何線除AZ,0-9,或特殊字符

刪除網址 - 說不定檢測「\」字符的長

刪除行超過16個字符,4個字符或更短。 (5-16字符)

最好在sed =)

謝謝!

+0

可以使用http://gskinner.com/RegExr/在未來建設regexs。另外,使用它將教會如何從頭開始製作它們。 – 2010-07-01 02:35:28

回答

0
sed -nr '/^[[:alnum:]]{5,16}$/p' words 
  • -n方式默認情況下不打印線
  • -r手段使用 '擴展' 的正則表達式

sed命令是:

  • /.../當我們有一個東西,匹配
    • ^...$一整條生產線只包括
      • [...]字符類的:
        • [:alnum:]字母數字字符
      • {5,16} 5和16
    • p倍之間
  • 那麼我們打印
+0

有沒有一種方法可以包含自定義字符? – MKv4 2010-07-01 01:54:43

+0

只要將它們包含在字符類中,例如''[[:alnum:] {} +&%]' – porges 2010-07-01 01:56:45

0
perl -ne "print if /^[a-zA-Z0-9{other allowed characters here}]{4,16}$/" 
+0

有什麼辦法可以在sed中做到這一點? – MKv4 2010-07-01 01:23:26

0

基於匿名:

egrep '^[a-zA-Z0-9{other allowed characters here}]{4,16}$' 
+0

有什麼辦法可以在sed中做到這一點? – MKv4 2010-07-01 01:22:51