0
在一個給定的.html頁面中,我有一個腳本標籤,如下所示: 如何使用美麗的湯提取「function getData()」下的「retrun」信息?如何使用Beautiful Soup提取<script>標記中的函數字符串?
<script>
function getData()
{
\t return "zip,city,state,MedianIncome,MedianIncomeRank,CostOfLivingIndex,CostOfLivingRank\n10452,Bronx,NY,20606,2,147.7,74";
}
function getResultsCount()
{
\t return "1";
}
</script>
當我更新下面的代碼時,出現錯誤(AttributeError:'NoneType'對象沒有屬性'text')。 url =「http://zipwho.com/?zip=91709&city=&filters=--_--_--_&&state=&mode=zip」 data = urlopen(url).read() soup = BeautifulSoup(data,「html.parser」) – jerry9855
@ jerry9855首先,不應該將網址設爲http://zipwho.com/?zip=91709&city=&filters=--_--_--_-- &狀態=&模式= zip'?另外,你應該從'html.parser'切換到'html5lib'(並且安裝了'html5lib'模塊)。 – alecxe