2012-01-31 87 views
0

我可以得到用nutch解析的http respone頭字段嗎?nutch - 有沒有辦法讓http響應頭域解析?

是否需要配置內置功能?

我看了網上,我找不到任何有關這方面的信息。

此外,如果我做本地文件系統爬網,有沒有辦法解析文件的頭? (尺寸,描述等字段?)

+0

你是怎麼知道響應頭字段沒有被解析的?我假設爲了下載一個頁面,nutch將不得不解析頭部字段,以便(至少)確定什麼是'Content-Length'。 – Kiril 2012-01-31 19:19:19

回答

-1

查看行144 here。你可以看到http響應頭文件可以被獲取,你可以使用這些信息。

對於第二個問題: 對於解析不同的文件類型,有一些由nutch提供的插件。你需要研究相同的特定文件類型並開始。

+1

請在回答中更新網址。 – Shafiq 2016-03-24 08:59:30