2013-04-27 84 views
13

我希望能夠採取現有的HTML代碼段並將其轉換爲降價。爲了這個目的 我已經試過pandoc:如何在保留非標記HTML標記的同時將HTML轉換爲Markdown?

pandoc test.html -o test.md 

這裏的test.html是這樣的:

Hello 

<!-- more --> 

and some more text 

<h2>some heading</h2>  

結果是這樣的:

Hello and some more text 

some heading 
------------ 

因此,它不僅轉換在降價中有直接意義的標籤。它還刪除了我想保留爲HTML的標籤(例如,HTML註釋,iframe標籤等)。

  • 如何將HTML轉換爲markdown,以便將任何在markdown中沒有等效功能的標記保留爲原始HTML?
  • 更一般我怎麼能有在如何HTML以降價轉換完成控制?

特別,我很感興趣的命令行程序的選項。例如,可能有可供應給pandoc的選項。

+2

有趣,我有完全相反的問題。它保持divs,而我沒有要求它 – Sebas 2017-03-10 11:34:45

回答

17

更多的搜索後,我讀到的thread on table parsing--parse-raw選項。

添加--parse-raw選項似乎不剝離非降價相當於HTML標籤。

pandoc test.html -o test.md --parse-raw