2011-06-09 49 views
1

我想閱讀一個HTML文件,並使用php將html內的表格內容轉換爲csv格式的文件。在php中的csv文件的HTML

一般來說,在一個目錄下的HTML,我有一個HTML文件列表說

KMC_Doctors_list_A.html 
KMC_Doctors_list_B.html 
KMC_Doctors_list_C.html 
.... 
KMC_Doctors_list_Z.html 

我想讀這些HTML文件和寫入其表的內容到CSV文件。

任何人都可以在這方面幫助我。

+0

你到目前爲止嘗試過什麼?並且需要更多詳細信息,是否要CSV文件內容,還是希望文件中的表格內容爲CSV? – 2011-06-09 18:27:11

+0

表格結構如何? – alexn 2011-06-09 18:27:13

+0

HTML文件是什麼樣子,請給我們看一些代碼。 – powtac 2011-06-09 18:27:21

回答

1

準備好閱讀:fputcsv將以csv格式寫入。但是你需要了解正則表達式preg_matchpreg_match_all在這個過程中會非常有用。沒有快捷方式將html轉換爲csv。

+2

'fputcsv':OK,爲了實際獲取數據,我寧願使用DOMDocument,然後創建一個脆弱的正則表達式。 – Wrikken 2011-06-09 18:34:10

+0

啊,當然,html總是不純淨,如果你走這條路線,你需要清理它:這裏有一個更好的討論:http://stackoverflow.com/questions/2702799/php-parsing-invalid-html – Candide 2011-06-09 18:37:06

+0

請不要' t建議正則表達式顯然是一個HTML解析工作:( – Erik 2011-06-09 20:51:16