2010-09-11 55 views
1

我試圖解析雅虎問答飼料 - http://answers.yahoo.com/rss/allq 的問題是,標題有正則表達式來簡化雅虎問答訂閱標題

【類別】:開放性問題:

在每一個標題,我做不想要...我想寫一個正則表達式來刪除這個...

任何我們可以做的,以消除所有的字母在開始[和第一:應該這樣做。

:之後還有一個空格,我們也需要刪除它。

感謝您的提前,我也會嘗試自己找到解決方案。

回答

1

您是否考慮過使用Yahoo的YQL服務來解析此提要(或其他網頁)?

他們已經有樣品查詢,爲您在雅虎找到答案數據:

(只是一個供參考的情況下,你不知道這項便利服務。我用它來代替RegEx的屏幕抓取。)

+0

太好了。萬分感謝!兩個答案都很棒! – foxybagga 2010-09-12 13:23:33

+0

感謝您的提示約翰。這很有幫助! – foxybagga 2010-10-06 22:47:34

1

以下的正則表達式應該做的工作:

^\[.*?: 

用法示例在C#:

string resultString = Regex.Replace(subjectString, @"^\[.*?: ", ""); 

它的作用是啓動與[托架,直到它匹配採取任何字符:和採取follwing空間。

希望這會有所幫助, Tom。

感謝@cmptrgeekken指出非貪婪的東西!

+1

可能想製作'。*?',所以這是一個非貪婪的匹配。否則,如果標題本身有一個冒號,這個正則表達式會刪除所有第二個冒號 – cmptrgeekken 2010-09-11 15:35:01

+0

謝謝指出! – RoXX 2010-09-11 15:57:36