2013-05-11 59 views
0

好吧,所以我在python中編寫了一個函數,它需要一個帶有===,==,---,#text等標記的文本文檔。等等(很像維基百科)。現在我的程序基本上必須用HTML標記代替它們,例如&-ndash,& mdash,<> text等,以便它們可以在瀏覽器中正確顯示。這是我到目前爲止:將純文本標記更改爲HTML標記以顯示在瀏覽器中python

​​

我在正確的軌道上?或者還有什麼我需要包括?我是相當新的這個

+1

您確定要實施「另一個標記格式」?如果你使用一個已經建立的(例如[restructured text])(http://docutils.sourceforge.net/docs/ref/rst/restructuredtext.html),你可以使用現有的工具來格式化它。 – 2013-05-11 13:22:16

+0

我不介意哪種方式我只要不需要導入一個新的模塊,如果我使用重構的文本,我應該去哪個方向? – user2368457 2013-05-11 13:32:02

+0

您可以詳細說明您嘗試實現的目標嗎?將其作爲學習體驗實施,構建文檔工具,博客平臺? – 2013-05-11 13:34:07

回答

0

你最好的選擇(如果你想編寫自己的功能,並避免使用現有的工具)是使用正則表達式,這是很簡單的

import re 

def subst(text): 
    str = '#text#' 
    capture = re.search('#(.+)#', str) 
    return '<li>'+ capture.group(1)+ '</li>' 

我希望你能想法 你也可以使用'==(。+)=='等模式來捕捉你想要的東西。 您可以查看這篇文章以瞭解更多有關使用re.search和re.match https://stackoverflow.com/a/180993/2152321

您還可以瞭解更多關於正則表達式模式構建這裏 http://www.tutorialspoint.com/python/python_reg_expressions.htm