2013-05-06 87 views
0

我正在寫一個程序,去我的學校成績網站,並把我的成績,使他們成爲我的桌面背景,但一旦我達到我的成績,我不能得到如何解析出大表美麗的湯解析表

這裏是我的代碼:

from bs4 import BeautifulSoup 
from selenium import webdriver 
from selenium.webdriver.common.keys import Keys 

driver = webdriver.Chrome() 
driver.get("https://ps.rsd.edu/public/") 

elem = driver.find_element_by_name("account") 
elem.send_keys("Username") 
elem2 = driver.find_element_by_name("pw") 
elem2.send_keys("Password") 
elem.send_keys(Keys.RETURN) 
html = driver.page_source 
soup = BeautifulSoup(html) 
print soup 
driver.quit() 

print "done" 

這個打印頁面的源代碼,但我希望得到檔次了一個名爲S2 對不起它有點兒難啃的,因爲我不能告訴你實際的網站

這裏是該行的所有名稱S IN表:

<table class="grid"> 
<tr><th class="center" colspan="25">Attendance By Class</th></tr> 
<tr class="center th2"> 
<th rowspan="2">Exp</th> 
<th colspan="5">Last Week</th><th colspan="5">This Week</th><th rowspan="2">Course</th> 
<th rowspan="2">Q1</th> 
<th rowspan="2">Q2</th> 
<th rowspan="2">S1</th> 
<th rowspan="2">Q3</th> 
<th rowspan="2">Q4</th> 
<th rowspan="2">S2</th> 
<th rowspan="2">Absences</th> 
<th rowspan="2">Tardies</th> 
</tr> 

,這是一個例子行:

<a href="scores.html? frn=004711281&begdate=01/23/2013&enddate=06/07/2013&fg=S2">B<br>84</a></td> 
<td><a 
+0

其很多代碼生病試圖得到相關部分 – Serial 2013-05-06 01:17:58

+0

這是整個表https://gist.github.com/C-Dubb/5522909 – Serial 2013-05-06 01:41:37

+0

只是從第二學期的數字那就是它 – Serial 2013-05-06 01:48:55

回答

1

這種資源可以幫助你:locating elements in selenium

您可以嘗試使用

find_element_by_link_text 

和獲得包含該課程成績的元素的課程名稱