2012-04-19 99 views
0

如何使用Notepad ++從文件中的所有URL找到並刪除utm_content參數?如何修剪以特定表達式開頭的字符串?

的樣本數據:

http://example.com/content1.html?utm_content=product1 
http://example.com/abc2.html?utm_content=homepage 
http://example.com/test/?utm_content=sku1234 
http://example.com/runapp?utm_content=31231KS 
http://example.com/blabla?utm_content=nl-laptops-tablets 

期望的結果:

http://example.com/content1.html 
http://example.com/abc2.html 
http://example.com/test/ 
http://example.com/runapp 
http://example.com/blabla 

注:根據我的理解記事本+ +正則表達式使用標準PCRE(的Perl)的語法。

+2

問題在哪裏? – 2012-04-19 13:45:38

+0

編輯了這個問題,謝謝! – Bogdan 2012-04-19 13:50:44

+1

這不是一個編程問題,因爲你只是在處理文本編輯器;因此我相信它屬於超級用戶。 – 2012-04-19 13:52:16

回答

2

據我瞭解你的需求:

搜索:

\?utm_content=.*?" 

"

+0

選擇一切,直到換行。示例數據應該看起來像這樣:'href =「http://example.com/content1.html?utm_content=nl-laptops-tablets」',我需要輸出這個'href =「http://示例。 COM/content1.html「'。我很抱歉沒有從一開始就解釋得更好。 – Bogdan 2012-04-19 14:02:41

+0

@Bogdan:我不明白你的意思。上述表達式適用於您提供的示例。 – Toto 2012-04-19 14:11:32

+0

這裏是樣本數據的更廣泛的視圖:' ' – Bogdan 2012-04-19 14:16:42

2

搜索替換爲\?utm_content=\w+\?utm_content=.*,並用零字符串替換它,如果是這樣的只有一個參數。

+0

這部分工作:'\?utm_content = \ w +'。但是,如果我有一個參數包含'-'字符,比如這個:'?utm_content = nl-laptops-tablets',它會選擇序列直到第一個'-' – Bogdan 2012-04-19 13:55:34

+0

@ChrisMorgan由於OP沒有足夠具體,整個網址可能如何看待。 – splash 2012-04-19 13:55:38

+0

@Bogdan正確。我的答案非常嚴格地處理這些例子! ;-) – splash 2012-04-19 14:01:50

-1

使用標準搜索&更換(按Ctrl + R)

編輯:

搜索:的utm_content

替換:

出版社找到,然後按替換休息。

+0

...並做什麼? – splash 2012-04-19 14:00:21

+0

這不是OP所要求的。 – splash 2012-04-19 14:06:31

+0

OP的原始問題是模糊的。 一個簡單的搜索和替換就足以解決原始問題。 編輯的問題更加清晰,並且需要RegEx – Nihil 2012-04-19 14:27:41

相關問題