我試圖解析雅虎問答飼料 - http://answers.yahoo.com/rss/allq 的問題是,標題有正則表達式來簡化雅虎問答訂閱標題
【類別】:開放性問題:
在每一個標題,我做不想要...我想寫一個正則表達式來刪除這個...
任何我們可以做的,以消除所有的字母在開始[和第一:應該這樣做。
:
之後還有一個空格,我們也需要刪除它。
感謝您的提前,我也會嘗試自己找到解決方案。
我試圖解析雅虎問答飼料 - http://answers.yahoo.com/rss/allq 的問題是,標題有正則表達式來簡化雅虎問答訂閱標題
【類別】:開放性問題:
在每一個標題,我做不想要...我想寫一個正則表達式來刪除這個...
任何我們可以做的,以消除所有的字母在開始[和第一:應該這樣做。
:
之後還有一個空格,我們也需要刪除它。
感謝您的提前,我也會嘗試自己找到解決方案。
您是否考慮過使用Yahoo的YQL服務來解析此提要(或其他網頁)?
他們已經有樣品查詢,爲您在雅虎找到答案數據:
answers.getbycategory: http://developer.yahoo.com/yql/console/#h=select%20 *%20from%20answers.getbycategory%20where%20category_id%3D2115500137%20於是%20type%3D%22resolved%22
answers.getbyuser: http://developer.yahoo.com/yql/console/#h=select%20 *%20from%20answers.getbyuser%20where%20user_id% 3D%22YbaMGtHFaa%22
answers.getquestion: http://developer.yahoo.com/yql/console/#h=select%20 *%20from%20answers.getquestion%20where%20question_id%3D%2220090526102023AAkRbch%22
answers.search: http://developer.yahoo.com/yql/console/#h=select%20 *%20from%20answers。搜索%20where%20query%3D%22cars%22%20於是%20category_id%3D2115500137%20於是%20type%3D%22resolved%22
(只是一個供參考的情況下,你不知道這項便利服務。我用它來代替RegEx的屏幕抓取。)
以下的正則表達式應該做的工作:
^\[.*?:
用法示例在C#:
string resultString = Regex.Replace(subjectString, @"^\[.*?: ", "");
它的作用是啓動與[
托架,直到它匹配採取任何字符:
和採取follwing空間。
希望這會有所幫助, Tom。
感謝@cmptrgeekken指出非貪婪的東西!
可能想製作'。*?',所以這是一個非貪婪的匹配。否則,如果標題本身有一個冒號,這個正則表達式會刪除所有第二個冒號 – cmptrgeekken 2010-09-11 15:35:01
謝謝指出! – RoXX 2010-09-11 15:57:36
太好了。萬分感謝!兩個答案都很棒! – foxybagga 2010-09-12 13:23:33
感謝您的提示約翰。這很有幫助! – foxybagga 2010-10-06 22:47:34