1

我有一個html代碼,我必須從中提取文本。如果它在href標籤中,我可以使用get_attribute(「text」),但是在這個奇怪的代碼中,沒有標籤。如何從沒有特定標籤的標籤中提取文本?

<h2 class="slideable title"> 
<span content-slot="title" transcluded="49763">Black Diamond Cheese Bars 400-450 g</span> 
</h2> 

我想有黑鑽奶酪棒400-450 g^

我試圖讓與名稱內容插槽元素,但我無法做到這一點。

+0

你嘗試過使用'soup.span.text'嗎? – Mahesh

+0

感謝您的回覆@Mahesh,我使用硒元素代替BS –

+0

它不清楚問題是什麼。你不能找到元素?你不能提取文本?別的東西? – Guy

回答

0

使用父類選擇,然後使用訪問子。使用BeautifulSoup

html.find('div',{'class':'slideable title'}).span.get_text() 
+0

感謝評論@ ashishkumar148,我使用硒查找元素而不是BS –

+0

您已添加bs標記,所以我想你使用它 – ashishkumar148

0

使用getText()方法(點)運算符來達致這,getAttribute()返回屬性值

試試這個

WebElement ele= driver.findElement(By.xpath("//span[@transcluded='49763']")); 
String s=ele.getText(); 
System.out.println(s);  

輸出:

黑鑽石芝士吧400-450克

+0

使用getext()方法,它的工作原理 – iamsankalp89

+0

感謝sankalp的回覆,是的,我可以做到這一點,但在我的情況下,我有很多帶有不同id的跨過名字。我無法使用它來獲取所有內容 –

+0

在這種情況下,請使用該元素的xpath或使用該ID來定位跨度,或使用if-else來檢查它。很高興幫助你請點擊右邊接受答案 – iamsankalp89