2016-11-15 57 views
0

我試圖找出其中包含一個特定的標籤頁,但是這個標籤包含谷歌標籤管理器中,並因此不可用在頁面源代碼,或DOM(從我所看到的)。如何加載URL並跟蹤所有請求的資源?

我可以Chrome開發工具內然而看到網絡選項卡上,其涉及於所討論的標籤的請求。

我不知道是否有一種方式來加載Python中的頁面,並跟蹤所有加載頁面時,這樣我就可以解析這個列表標識我提出的要求的。

不知道是否有一個明顯的是這樣做的,但我似乎無法找到在任何請求模塊或urllib3相關的任何東西。

編輯 - 更多信息:

我特別嘗試識別AdWords轉換標籤。我知道這採取了https://www.google.com/ads/conversion/xxxxxxxxxx/的請求形式。對於大多數網站,代碼在頁面源中可見,有時僅在DOM中可見。我使用前者的請求模塊,後者使用phantomjs。但是,如果網站使用的是Google跟蹤代碼管理器,它似乎並不在其中。

我可以看到但這一請求被在Chrome瀏覽器開發工具進行的網絡選項卡,所以希望有一種方法,以蟒蛇內直接複製嗎?

+0

我在同一個主題,用Ruby UT斯達康進行一些測試。 –

回答

0

有些疼痛試圖PhantomJS使用OnResourceRequested後,我代替以下內容:

chromedriver = "/path/to/chromedriver" 
    os.environ["webdriver.chrome.driver"] = chromedriver 
    self.driver = webdriver.Chrome(chromedriver) 

    self.driver.get(link) 

    time.sleep(5) 
    timings = self.driver.execute_script("return window.performance.getEntries();") 
     for item in timings: 
      print item[u'name']