2011-04-19 229 views
0

有沒有辦法從網頁獲取時間戳?在這種情況下,新聞故事網頁。我曾嘗試將它們隔離在XHTML的字符串內容中,但變化太多。我已經搜遍了所有人,但所有人都可以做到的是獲取當前日期從網頁獲取時間戳?

+2

「timestamp」是指「最後修改」日期? – 2011-04-19 06:52:03

+0

是的網頁進入一個字符串 - 我只是想拉出時間戳。 BUt在XHTML的不同上下文中有數百萬個時間戳,我想知道PHP是否有函數 – Graham 2011-04-19 07:02:53

+0

* *網頁的源代碼在''標籤中包含「最後修改時間」的時間戳?因爲它通常不會。該信息通常來自源代碼中不可見的標題。但如果它在那裏,請顯示在哪個表單中,以便人們可以建議一種方法將其過濾出來。 – 2011-04-19 07:05:05

回答

1

你能檢查Last-Modified響應標題嗎?請參閱標題完整列表中的for details

0

您可以通過下面的代碼獲取標題。儘管如此,沒有多少網站實施上次修改日期。

<?php 
$ch = curl_init(); 
curl_setopt($ch, CURLOPT_URL, $url); 
curl_setopt($ch, CURLOPT_HEADER, TRUE); 
curl_setopt($ch, CURLOPT_NOBODY, TRUE); // remove body 
curl_setopt($ch, CURLOPT_RETURNTRANSFER, TRUE); 
$head = curl_exec($ch); 
?> 
+0

有趣。我想你必須對代碼進行排序 - 只需選擇最常出現的代碼即可。我正在解碼新聞提要,因此代碼中的多樣性引發了系統關閉 - 例如,Reuter的故事只有兩個共同的主題 - 一個在主文本之前,然後是文本之後的一個文本。但不總是。 HAAH。 – Graham 2011-04-19 09:27:00