得到網頁中的所有鏈接時,我測試了一下,一直打印出來(無,0),即使我使用url有幾個< A HREF =要使用urllib.request裏
import urllib.request as ur
def getNextlink(url):
sourceFile = ur.urlopen(url)
sourceText = sourceFile.read()
page = str(sourceText)
startLink = page.find('<a href=')
if startLink == -1:
return None, 0
startQu = page.find('"', startLink)
endQu = page.find('"', startQu+1)
url = page[startQu +1:endQu]
return url, endQu
忘了提,我不能使用任何第三方模塊。 – Anymee