regex-lookarounds

    0熱度

    1回答

    在正則表達式中,以積極的向前或向後的方式捕獲文本會很有用。但是,Oniruguma(例如)支持捕獲組負向向前看(儘管不是負面的後顧之憂)。盡我所能,這可以爲從來沒有導致捕獲的值。我是對的嗎,還是我錯過了什麼?

    2熱度

    2回答

    如發現斜線和匹配關鍵詞的詞: http://www.domain.com/junk/target/keyword/junk 我想從上面的網址摳字眼「目標」。 到目前爲止,我有以下表現: (?=\/).*?(?=\/keyword\/) 然而,這一切拉從第一個斜槓(「//www.domain.com/junk/target」)

    -1熱度

    1回答

    在下面的XML片段中,當Parent節點是E1EDKA2並且元素PARVW等於AG時,我需要提取NAME1的值並將其存儲在變量中。 <DESADV01> <IDOC> <E1EDKA2 SEGMENT="1"> <PARVW>AG</PARVW> <PARTN>0001703217</PARTN> <NAME1>WILBUR ELLIS R

    0熱度

    1回答

    我必須從PDF流中拉出一些文本作爲字符串。該流將包含用於描述文本外觀的標記以及文本本身。我收到的字符串,我的正則表達式將不得不運行將不會包含任何回車或換行符。我感興趣的文本的區域總是在括號內(並且可能會在括號內加括號),並且在最後的括號之後將會有字母'Tj'。總之,我是什麼之後將始終遵循約定: (.....) Tj 目前,正則表達式我有工作,只要括號都是平衡: \((?:[^()]|(?'pa

    0熱度

    1回答

    問題是我必須將數據標記爲基於空格的標記,同時我不能根據特殊字符標記數據。眼下正則表達式我已經是 (\w*[-*#+=;:\/,~_ ]*\w+) 有了這個,當我處理 1-CHECK ON BLOCKS BELOW IF MARKET CORRECTION ARE LOADED: PCORP:BLOCK=ANCTRLG&V5PTCLG; AF55722 BRTBMWA-3289 (AF

    1熱度

    1回答

    在Notepad ++中,我想用引用鍵替換所有引用/引用。 例如,以下內容: Bla bla bla bla (van Author et al., 2015). Bla bla bla (Authorone, Authortwo, & Authorthree, 2016). Bla bla (Authorone & Authortwo, 2017). 應該改爲: Bla bla bla

    1熱度

    2回答

    我想在Java中寫一個正則表達式獲取所有兩位數字(兩位數字不能以0開頭),它不會在前面和隨後是一個角色。 舉例來說,我想在下面的字符串匹配數30: character30 wordstart wordstart 30character 30的數量就在這裏 但不希望到以下: character30character 我想使用一下變通做到這一點,到目前爲止,我來最接近的是: (?<!\w)(1[2-9

    0熱度

    2回答

    我想要得到tweet中沒有提到的詞(以@開頭)或標籤(以#開頭)。 我的代碼是這樣的: import re pattern=r'(?u)\b\w\w+\b' pattern=re.compile(pattern) pattern.findall('this is a tweet #hashtag @mention') 與此正則表達式的結果是 這是一個鳴叫包括hashtag提 ,但我不希望

    1熱度

    4回答

    我解析製表符分隔的文件一行一行: Root rootrank 1 Bacteria domain .72 Firmicutes phylum 1 Clostridia class 1 etc. = while (my $line = <$fh>) { chomp($line); } 在每一行,我想捕捉前第一入口並在特定的比賽之後。例如,對於匹配phylum,我想要捕獲條目Fir

    0熱度

    1回答

    大家,我有一個正則表達式的問題在這裏,我要分析此日誌文件,現在我想進去鍵和值的SESSION 的問題是,這些日誌看起來並不相同,其中一些缺少包含'SESSION'的#字符,但它們都包含單詞SESSION,以便從變量塊開始,然而它們都以另一個總是包含單詞「POST」或「API CURL CALL」。 所以我必須使用量詞最有可能使其在這些字符串,但是當比賽這是一個鍵和值(由:)這兩個其他值的內部分離的