2015-02-05 67 views
2

我想用R和SelectorGadget中的rvest軟件包來標識我的CSS選擇器,以從Glassdoor(該API僅提供彙總評級)提取個人評級。用rvest刮圖像標題

問題是Glassdoor使用圖像來傳達評分,但數字評分包含在圖像標題中。使用SelectorGadget,我可以從下面的代碼片段中使用「Comp & Benefits」文本(使用「#EmployerReviews undecorated li」),但是我無法在span ... title =部分中找到「2.0」是我想要的。

<div id='EmployerReviews'> .... <ul class='undecorated'> <li> <div class='minor'>Comp & Benefits</div> <span class='notranslate notranslate_title gdBars gdRatings med ' title="2.0"> 

人有成功刮影像標題,在過去,或另一種方式來獲得這些個體評級知道嗎?

回答

4

您需要選擇範圍,並使用html_attr()以提取其屬性值:

html <- html("...") 
rating <- html %>% 
    html_nodes("#EmployerReviews .undecorated li span.gdRatings") %>% 
    html_attr("title") 

rating 
# [1] "2.0"