2016-12-27 85 views
0

我有一個字符串WWW,HTTP和鏈接如example.com從字符串,我要做到以下幾點:刪除所有環節開始使用正則表達式

  1. 刪除所有環節開始,HTTP,HTTPS, www

  2. 刪除鏈接,如example.com,example.netexample.us,還有example.com/foo。而example.com可能是一個不同的網站。

  3. 我想保留小數點,如3.14。

我不是在正則表達式一個專業的,但我想下面的表達式:

http[^\s]+|www[^\s]+ 

它與HTTP,HTTPS和www工作。現在我堅持與example.com等....

謝謝。

輸入:

這是文本http://www.example.comhttps://www.example.comwww.example.comexample.comexample.usexample.us/test這是文字3.14

輸出:

這是文字這是文字3.14

+0

顯示輸入文字,並用實例 – RomanPerekhrest

+0

? –

+0

什麼'example.com/foo'更新預期輸出 – 2016-12-27 19:57:41

回答

1

你可以使用正則表達式是這樣的:

[^\s\d]+\.[^\s\d]+ 

Working demo

+0

這將刪除所有的小數點以及3.14 –

+0

@IgorLevashov,修正了,現在檢查 –

+0

太棒了!非常感謝! –

0

嘗試更換:

(https?:\/\/)?(www\.)?\w+\.\w+ ? 

沒事

注意,這不會對網址像irc.example.com對於使用工作:

(https?:\/\/)?(\w\.)*\w+\.\w+ ? 

然而,這些regrexs匹配所有單詞。在他們中,例如13.34。 (但不是Mr.)所以要小心。

(上streetturtle的代碼基礎)