美麗的湯解析表

我正在寫一個程序，去我的學校成績網站，並把我的成績，使他們成爲我的桌面背景，但一旦我達到我的成績，我不能得到如何解析出大表美麗的湯解析表

這裏是我的代碼：

from bs4 import BeautifulSoup 
from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 

driver = webdriver.Chrome() 
driver.get("https://ps.rsd.edu/public/") 

elem = driver.find_element_by_name("account") 
elem.send_keys("Username") 
elem2 = driver.find_element_by_name("pw") 
elem2.send_keys("Password") 
elem.send_keys(Keys.RETURN) 
html = driver.page_source 
soup = BeautifulSoup(html) 
print soup 
driver.quit() 

print "done"

這個打印頁面的源代碼，但我希望得到檔次了一個名爲S2 對不起它有點兒難啃的，因爲我不能告訴你實際的網站

這裏是該行的所有名稱S IN表：

<table class="grid"> 
<tr><th class="center" colspan="25">Attendance By Class</th></tr> 
<tr class="center th2"> 
<th rowspan="2">Exp</th> 
<th colspan="5">Last Week</th><th colspan="5">This Week</th><th rowspan="2">Course</th> 
<th rowspan="2">Q1</th> 
<th rowspan="2">Q2</th> 
<th rowspan="2">S1</th> 
<th rowspan="2">Q3</th> 
<th rowspan="2">Q4</th> 
<th rowspan="2">S2</th> 
<th rowspan="2">Absences</th> 
<th rowspan="2">Tardies</th> 
</tr>

，這是一個例子行：

<a href="scores.html? frn=004711281&begdate=01/23/2013&enddate=06/07/2013&fg=S2">B<br>84</a></td> 
<td><a

來源

2013-05-06 Serial

其很多代碼生病試圖得到相關部分 – Serial 2013-05-06 01:17:58

這是整個表https://gist.github.com/C-Dubb/5522909 – Serial 2013-05-06 01:41:37

只是從第二學期的數字那就是它 – Serial 2013-05-06 01:48:55

這種資源可以幫助你：locating elements in selenium

您可以嘗試使用

find_element_by_link_text

和獲得包含該課程成績的元素的課程名稱

來源

2013-05-07 01:11:49 eqzx

美麗的湯解析表

回答

相關問題