2012-01-11 48 views
5

文本我有一堆的HTML文件和需要轉換和格式化用Perl即財產以後像<br/>將interperted到\n轉換HTML使用Perl

我發現CPAN的HTML ::這個Perl模塊來短信formattext它格式化文本很好,但如果有鏈接它剝離它, 在那裏爲的是文字,但是當 有鏈接像這樣

<a href="http://www.microsoft.com>http://www.microsoft.com</a> 

即財產以後這樣與HTML::FormatText任何選項格式化HTML:

<br /><b>Microsoft</b><br /><a href="http://www.microsoft.com>` 

將被轉換爲:

microsoft 
http://www.microsoft.com 
+2

我總是用* lynx *來做到這一點,因爲我從來沒有找到更好的東西。不過,我很想去。 – tchrist 2012-01-11 20:29:50

+1

如果你已經安裝了'lynx',那麼['HTML :: FormatText :: Lynx'](http://search.cpan.org/perldoc?HTML::FormatText::Lynx) – mob 2012-01-11 21:02:33

回答

6

看看HTML::FormatText::WithLinks

設置after_link選項,說: 「(%L)」,將鏈接放入線錨後文本。在你的例子中,你會得到Microsoft (http://www.microsoft.com)

+0

我看到它插入了這個模塊最後的鏈接作爲腳註,是否有可能保持鏈接的位置? – smith 2012-01-11 20:21:32

+0

概要中的第二個例子展示瞭如何做到這一點(該例子的括號中有URL,但它不一定是)。 – theglauber 2012-01-11 23:07:10

+0

是的,你可以把鏈接放在一行。我修改了我的答案來解釋。 – Borodin 2012-01-12 01:22:15