2013-03-14 86 views
0

我想解析一個html頁面並從中提取標籤。我需要一些好的算法在C語言中做這些建議?我試圖尋找庫,但多數人似乎支持Python和Ruby或Java但遺憾的是沒有什麼是有C.通用標記語言解析器

+0

看看libxml2,htmltidy,expat等 – 2013-03-14 07:37:01

+0

謝謝你的幫助,我確實研究過它們,看起來它們可能很有用,但是我想從頭開始編寫我自己的解析器,然後遞歸下降的方式來編寫它好。?我不想一次解析文件一個字符,任何更好的方法來提高解析速度。 – user2164540 2013-03-14 08:55:50

回答