在webspiders/crawlers中,我怎樣才能得到實際的初始用戶在HTML文檔中看到的字體的渲染大小,在記住CSS。如何獲取網頁上字體的大小?
0
A
回答
3
渲染文本大小? 用戶可以使用他/她的瀏覽器設置隨意更改文字大小。 更不用說不同的瀏覽器呈現相同的內容略有不同。
0
如果你滿意的答案是爲「默認」,爲了這個目的沒有用戶自定義視圖(這很可能),我相信你正在尋找一個相當痛苦的情景:
嵌入在您的蜘蛛中支持CSS 的渲染引擎。希望 使用與您的用戶的大多數 匹配的引擎,或者使用 所有三種通用引擎,並存儲 所有這些引擎的信息。您的消費技術在 嵌入方便程度差異很大。
將正在爬行的URI加載到 渲染引擎中。
使用引擎的API,查詢它的 字體規格包含你認爲 代表文本元素 (選擇這 爲此我甚至不會 開始預測策略的運動)。 如何訪問此操作完全取決於 您的 引擎的嵌入方案。
我希望這是'硬道路',但我不確定是否有'簡單'的方法。
相關問題
- 1. 如何獲取網頁中元素的文字字體大小
- 2. 在網頁上獲取圖像大小
- 3. 如何從CMFCPropertyFontProperty獲取字體大小
- 4. Java獲取字體大小
- 5. 獲取字體大小
- 6. 如何獲取UILabel的字體大小和字體名稱?
- 7. 網頁的字體大小和行高
- 8. CSS - 提高網頁字體大小
- 9. 網站上的不同字體大小
- 10. SVG - 獲取TextElement的字體大小
- 11. 獲取div的計算字體大小
- 12. 如何使用自定義字體大小獲取字符大小
- 13. ASP.net無法獲取字體大小
- 14. Ruby代碼獲取網頁的字節大小
- 15. 如何獲取頁面大小
- 16. Java - 如何獲取JTextPane的默認字體大小
- 17. 如何獲取HTML中的字體大小
- 18. 如何在自定義UITableViewCell中獲取UILabel的字體大小?
- 19. 如何獲取ace編輯器的當前字體大小?
- 20. 如何獲取html標籤的字體大小
- 21. 如何獲取網頁上可見DOM元素的可視大小
- 22. Winforms上的字體大小
- 23. 如何減少網站的整體字體大小?
- 24. 如何使用pdfbox獲取字體大小
- 25. 用CGContextShowGlyphsAtPoint繪製文本 - 如何獲取字體大小?
- 26. 從文本中獲取字體和字體大小?
- 27. iPhone上的字體大小小於PC
- 28. 不同手機上的網站上的字體大小相同
- 29. 如何獲取ImageRendition大小?
- 30. 如何縮小字體大小?
將使用瀏覽器的默認大小,除非它設置在某處。通常CSS中的字體總是至少設置一次。爬蟲應該查看DOM層次結構來確定使用了哪種CSS設置,除非它被HTML本身的內聯CSS覆蓋。相當多的工作,但可能的。雖然將標題與普通文本分開以便更好地瞭解是什麼,但可能會更容易。 – Alec 2009-06-19 21:26:02