2010-06-02 129 views
0

我需要使用正則表達式從url域中取出一個值,該值將排除除主機(例如:wordpress)和域類型(ex .com)之外的所有內容。這些網址是動態的,每個結果包含2-3個值(www.example.com或example.org)。我想用這句話,但我只是找回我試圖排除每一個項目的第一個字母:正則表達式不是運算符

Expresssion

(?!wordpress|com|www)(\w+|\d+) 

字符串

例子.wordpress.com

個結果

  1. 例如
  2. ordpress
  3. OM
  4. 所需的結果

例如

任何援助將不勝感激

+1

我真的很難理解你的問題。輸入的模式是什麼?你想爲每個URL匹配返回什麼? – 2010-06-02 20:47:16

回答

3

錨你正則表達式:

\b(?!wordpress|com|www)(\w+|\d+)\b 

您可能還想考慮是否(\w+|\d+)確實是您的意思。 \w已包含數字。此外,網址中還有其他字符,例如-。你需要處理這個嗎?

0

如果我做的事情一樣,我會趁着網址的格式:任何東西(點)2級域(點)第一級域:

^(?<level3>.*)[.]?(?<level2>.+)[.](?<level1>.+)$

0

它是否只是在域部分之後?

(/\/(?!\/).*?\/(.*)/).exec("http://www.google.com/sdfsdf/fdsff")[1] 
// returns sdfsdf/fdsff 
相關問題