2011-04-11 30 views
0

此鏈接的元描述:http://www.mercurynews.com/samesexmarriage/ci_17794445?source=most_viewed&nclick_check=1元數據未解碼PHP

返回的是一個奇怪的字符而不是引號。

The federal judge who struck down Californias gay marriage ban has confirmed that hes gay. Chief U. 

我使用strip_tags(html_entity_decode(htmlspecialchars_decode($description, ENT_NOQUOTES), ENT_NOQUOTES, "UTF-8"));

什麼辦法呢?怪異的字符出現在地方報價的單詞「加州」和「他」

回答

1

該網站是不正確編碼的HTML實體。在源那些撇號應編碼爲' - 爲對撇號(十進制數39)的十六進制數的實體。他們使用,這對ASCII「逃亡」字符的十進制數的實體。

您可以通過添加一個str_replace電話支付他們的錯誤很容易地:

$description = str_replace('', "'", $description); 
$description = strip_tags(html_entity_decode(htmlspecialchars_decode($description, ENT_NOQUOTES), ENT_NOQUOTES, "UTF-8")); 

Reference for ASCII codes