0
我想解析一個html頁面並從中提取標籤。我需要一些好的算法在C語言中做這些建議?我試圖尋找庫,但多數人似乎支持Python和Ruby或Java但遺憾的是沒有什麼是有C.通用標記語言解析器
我想解析一個html頁面並從中提取標籤。我需要一些好的算法在C語言中做這些建議?我試圖尋找庫,但多數人似乎支持Python和Ruby或Java但遺憾的是沒有什麼是有C.通用標記語言解析器
嘗試使用HTML整潔
更多的參考可以在這裏找到: http://curl.haxx.se/libcurl/c/htmltidy.html
看看libxml2,htmltidy,expat等 – 2013-03-14 07:37:01
謝謝你的幫助,我確實研究過它們,看起來它們可能很有用,但是我想從頭開始編寫我自己的解析器,然後遞歸下降的方式來編寫它好。?我不想一次解析文件一個字符,任何更好的方法來提高解析速度。 – user2164540 2013-03-14 08:55:50