2011-04-04 37 views
0

我正在處理大量由5K多個不同實體準備的文檔。我試圖做的一件事是確定一個盒子是否被檢查過。編制者需要通過檢查五個不同框中的一個來指示一些信息。試圖編寫一些代碼來確定是否在html頁面中檢查了框

問題是編寫者自己決定如何在html中顯示一個複選框。他們的一些表示很有趣。他們主要依靠wingdings作爲字體指令。這裏有幾個類型的選中的複選框的我發現迄今

'serif">S</font>' 
'wingdings">x</font>' 
'&#252;' 
'&#253;' 
'&#254;' 


<font style="font-family: Wingdings; font-variant: normal">&#254;</font> 

的一段代碼,我上面粘貼的文件被打開時與IE瀏覽器的變體將顯示一個確認框,它會呈現什麼否則當文檔用Firefox,Safari或Chrome打開時。

下面是另一個例子

<div style="DISPLAY: block; MARGIN-LEFT: 0pt; TEXT-INDENT: 0pt; MARGIN-RIGHT: 0pt" align="center"><font style="DISPLAY: inline; FONT-SIZE: 10pt; FONT-FAMILY: times new roman">THE DATA THAT HAS THE CHECKED BOX <font style="DISPLAY: inline; FONT-FAMILY: wingdings 2, serif">R</font></font></div> 

所以我想最簡單的形式,我的問題是

有什麼python中「知道」是

<font style="DISPLAY: inline; FONT-FAMILY: wingdings 2, serif">R</font> 

這是一個檢查框?然後進一步擴展 - 是否有什麼'知道'這個幾乎每一個檢查框可以呈現在HTML代碼中的方式?

我要說明的是,當我檢查的字體元素的文本,我得到一個Unicode [R

我希望這是更清晰。

+0

對我們所問的沒有任何意義。請更改您的問題,並以較少的blabla來達到這個程度......具體的問題是什麼 - 將其歸結爲兩個句子。 – 2011-04-04 01:57:43

+0

相反,如果任何人有另一種方式,我可以考慮這個問題,將不勝感激。 – PyNEwbie 2011-04-04 02:08:55

+0

你真正的問題是什麼?將其縮減爲兩個句子... – 2011-04-04 02:11:14

回答

0

我看到它的方式,它看起來像這樣。

'S'的ascii值是83.如果在wingdings上查找83,就會得到「小滴」。 Unicode等效的「滴」是。

'x'的ascii值是120.在wingdings上查看120,您會看到「清晰」。 Unicode⌧。

252是wingding「checkbld」,unicode✓。

253是狂怒 「boxxmarkbld」 的unicode☒

254是狂怒 「boxcheckbld」 的unicode☑。

「R」是根據字體家庭wingdings2,ASCII 82,和unicode等效☑

注顯示:這只是一個猜測哪個是哪個。不要聽我的話。 我認爲這將是如此,因爲它似乎是有道理的。我的來源是Here (wingdings)Here (wingdings2)

解決方案評論:[√](左括號,amp,磅,8730,分號,右括號)。 &#8730被解釋爲U + 221A,分號是「結束語句」類型字符。根據fileformat.info,U + 221A是平方根符號,位於python u'\ u221a'中。這應該可以解決你的問題。

我給出的所有答案都是純粹的猜測和猜測,儘管通過鏈接和python2.7驗證了字符代碼和等價物。1的chr()和ord()。

相關問題