2012-12-05 19 views
1

我試圖自動化我維護的內部售票系統的一些單調乏味的Web任務。 有一個頁面,其中自動生成的表格充滿郵件服務器配置。每行用於不同的郵件服務器,每行的最後一列包含2個鏈接,如果該行中的第一列與特定單詞匹配,則需要能夠提取第一個鏈接。我正在嘗試在Python中使用機械化來做到這一點。如何從包含特定單詞的表的最後一列提取URL,使用機械化

的表稱爲像這樣:

<table id="pop-mail-servers-table" class="aui aui-table-rowhover"> 

,並在討論的行看起來是這樣的:

  <tr> 
        <td> 
         <span class="mail-server-name"> 
          <strong>testhandler-mcfake</strong> 
         </span> 
                 <div class="description"></div> 
               </td> 
        <td> 
         <ul class="item-details"> 
          <li> 
           <dl> 
            <dt>Host:</dt> 
            <dd><span class="mail-server-host">fake.mail.server</span></dd> 
           </dl> 
           <dl> 
            <dt>Username:</dt> 
            <dd><span class="mail-server-username">testhandler-mcfake</span></dd> 
           </dl> 
          </li> 
         </ul> 
        </td> 
        <td> 
         <ul class="operations-list"> 
          <li><a id="edit-pop-10550" href="UpdatePopMailServer!default.jspa?id=10550">Edit</a></li> 
          <li><a id="delete-pop-10550" href="DeleteMailServer!default.jspa?id=10550">Delete</a></li> 
         </ul> 
        </td> 
       </tr> 

所以基本上如果第一列中包含「testhandler-mcfake」,那麼我想從同一行的最後一列中提取該編輯網址。

這是一回事嗎?可以做到嗎?

回答

1

PyQuery允許您使用jQuery-like語法來選擇HTML元素。