我一直在搜索,瀏覽stackoverflow正則表達式解決方案,直到我眼鏡蛇。正則表達式幫助 - 嵌入報價字符串中的雙引號
我有一個第三方解決方案提供了一個「製表符分隔的文本文件」,但我已經確定了生成這個文件的任何東西是嵌入雙引號(甚至沒有轉義它們) - 我想知道它的可能性使用RegEx從文件中清除這些錯誤(我在導入之前在文件上使用FNR)。
每行數據包含14列,製表符分隔,每個字段周圍都有雙引號,如預期的那樣。所有的缺陷發生在第2場或第10場(不是第一場或最後一場),因爲這些都是訓練課程 - 一些教練使用名稱中帶有雙引號的名字 - 而這份第三方報告並沒有逃避它們。我希望之前和正確的引號後趕上TAB - 和過濾任何內部錯誤雙引號或者\正確轉義」
"......" "ADC000000" "Being the "Best" you can be" "2F8A776C" "...."
"......" "BBC555555" ""Golden Opportunity"" "8F4C3DEE" "...."
所需的輸出
"......" "ADC000000" "Being the \"Best\" you can be" "2F8A776C" "...."
"......" "BBC555555" "\"Golden Opportunity\"" "8F4C3DEE" "...."
或(取是最簡單的,並且相當快的文件中都有22萬行,只有16-50錯誤)
"......" "ADC000000" "Being the Best you can be" "2F8A776C" "...."
"......" "BBC555555" "Golden Opportunity" "8F4C3DEE" "...."
遺憾的這個冗長,但我想這個問題是因爲possi清晰BLE。
非常感謝Avinash的快速響應,這看起來非常接近 - 但也在每行的開頭和結尾都選擇了引號。有沒有辦法避免匹配這些情況? – RLW 2014-09-21 12:59:12
不,你看過上面的演示嗎? – 2014-09-21 13:01:06
我可能說話太快了,我正在使用debuggex.com嘗試自己弄清楚 - 但我遵循了你的演示鏈接,它沒有這個問題。請給我一點時間來弄清楚如何將這些信息提供給FNR。 – RLW 2014-09-21 13:27:21