<a href="/apartamento-en-venta/bogota/nicolas_federman-det-2658430.aspx" title="Apartamento en Venta - Bogotá Nicolás de Federmán">
<div>
<h2 class="h2-grid">
Apartamento en Bogotá - Nicolás De Federmán
</h2>
</div>
<br/>
<div>
Cundinamarca
</div>
</a>
,
<a href="/apartamento-en-venta/ibague/multicentro-det-2952281.aspx" title="Apartamento en Venta - Ibagué Multicentro">
<div>
<h2 class="h2-grid">
Apartamento en Ibagué - Multicentro
</h2>
</div>
<br/>
<div>
Tolima
</div>
</a>
,
<a href="/apartamento-en-venta/bogota/bella_suiza-det-2865659.aspx" title="Apartamento en Venta - Bogotá Bella Suiza">
<div>
<h2 class="h2-grid">
Apartamento en Bogotá - Bella Suiza
</h2>
</div>
<br/>
<div>
Cundinamarca
</div>
</a>
,
<a href="/apartamento-en-venta/bogota/cedritos-det-2844663.aspx" title="Apartamento en Venta - Bogotá Cedritos">
<div>
<h2 class="h2-grid">
Apartamento en Bogotá - Cedritos
</h2>
</div>
<br/>
<div>
Cundinamarca
</div>
</a>
,
<a href="/oficina-en-venta/bogota/usaquen-det-3036032.aspx" title="Oficina en Venta - Bogotá Usaquén">
<div>
<h2 class="h2-grid">
Oficina en Bogotá - Usaquén
</h2>
</div>
<br/>
<div>
Cundinamarca
</div>
</a>
如何從上面的html元素獲取'aspx'鏈接。從上面的html內容我需要獲取以下值如何從html元素獲取href內容
/apartamento-en-venta/bogota/nicolas_federman-det-2658430.aspx
/apartamento-en-venta/ibague/multicentro-det-2952281.aspx
/apartamento-en-venta/bogota/bella_suiza-det-2865659.aspx
/apartamento-en-venta/bogota/cedritos-det-2844663.aspx
我用下面的Python代碼來獲取html元素,需要知道如何獲得ASPX值 URL =「https://www.fincaraiz.com.co/finca-raiz/?ad=30|2||||1||||||||||||||||||||||1|||1||||||」
import re
import requests
from bs4 import BeautifulSoup
page = requests.get(url)
soup = BeautifulSoup(page.content , 'lxml')
index = soup.findAll('div' , 'span-title')
x = []
for i in index:
x.append(i.find('a'))
print (x)
我已經張貼上面的代碼的URL輸入它的Python代碼
你必須使用正則表達式,像 'soup.find(href = re.compile('''someregex''))' –