我正在處理大量由5K多個不同實體準備的文檔。我試圖做的一件事是確定一個盒子是否被檢查過。編制者需要通過檢查五個不同框中的一個來指示一些信息。試圖編寫一些代碼來確定是否在html頁面中檢查了框
問題是編寫者自己決定如何在html中顯示一個複選框。他們的一些表示很有趣。他們主要依靠wingdings作爲字體指令。這裏有幾個類型的選中的複選框的我發現迄今
'serif">S</font>'
'wingdings">x</font>'
'ü'
'ý'
'þ'
<font style="font-family: Wingdings; font-variant: normal">þ</font>
的一段代碼,我上面粘貼的文件被打開時與IE瀏覽器的變體將顯示一個確認框,它會呈現什麼否則當文檔用Firefox,Safari或Chrome打開時。
下面是另一個例子
<div style="DISPLAY: block; MARGIN-LEFT: 0pt; TEXT-INDENT: 0pt; MARGIN-RIGHT: 0pt" align="center"><font style="DISPLAY: inline; FONT-SIZE: 10pt; FONT-FAMILY: times new roman">THE DATA THAT HAS THE CHECKED BOX <font style="DISPLAY: inline; FONT-FAMILY: wingdings 2, serif">R</font></font></div>
所以我想最簡單的形式,我的問題是
有什麼python中「知道」是
<font style="DISPLAY: inline; FONT-FAMILY: wingdings 2, serif">R</font>
這是一個檢查框?然後進一步擴展 - 是否有什麼'知道'這個幾乎每一個檢查框可以呈現在HTML代碼中的方式?
我要說明的是,當我檢查的字體元素的文本,我得到一個Unicode [R
我希望這是更清晰。
對我們所問的沒有任何意義。請更改您的問題,並以較少的blabla來達到這個程度......具體的問題是什麼 - 將其歸結爲兩個句子。 – 2011-04-04 01:57:43
相反,如果任何人有另一種方式,我可以考慮這個問題,將不勝感激。 – PyNEwbie 2011-04-04 02:08:55
你真正的問題是什麼?將其縮減爲兩個句子... – 2011-04-04 02:11:14