2010-09-10 102 views
8

我有一個很好的黑客Perl腳本來自動從iTunes Connect中下載和下載銷售報告文件。截至今日,蘋果公司徹底改變了銷售報告網站。它看起來好多了,但它使用了大量的JavaScript,簡單的抓取不會再起作用。自動從iTunes Connect下載銷售報告

那麼,有沒有人知道一種方法來有效地刮這個新網站?

部分previousquestions指向各種腳本和在線服務。我想現在他們全部都壞了。如果你知道某個功能仍然有效,請告訴我。

回答

7
+0

這工作完美。非常好的工作。謝謝! – 2010-09-14 13:22:31

+0

要清楚,這不是我的工作。它是http://stackoverflow.com/users/245020/kirby-t – Hafthor 2010-09-14 17:03:35

+0

蘋果是否有可能在過去的24小時內再次改變事情?我剛剛嘗試了腳本v2.0.1並且它不工作(第245行的錯誤:列表索引超出範圍) – Brian 2010-09-15 14:40:20

1

嘗試免費的iMacros Firefox插件。它有廣泛的web scraping支持,並且因爲它在瀏覽器中工作,它可以處理Javascript。您也可以通過command line啓動它。

編輯:這確實有效。這是一個下載過去3天銷售報告的宏。我還沒有嘗試與命令行工具集成,但它應該工作。

VERSION BUILD=6650406 RECORDER=FX 
TAB T=1 
URL GOTO=https://itunesconnect.apple.com/ 
TAG POS=1 TYPE=INPUT:IMAGE FORM=NAME:appleConnectForm ATTR=NAME:1.Continue&&SRC:https://itunesconnect.apple.com/AppleConnect/US-EN/labelconnect/btn_signin.png 
TAG POS=1 TYPE=B ATTR=TXT:Sales<SP>and<SP>Trends 
TAG POS=1 TYPE=A ATTR=ID:theForm:saletestid 
TAG POS=1 TYPE=SELECT FORM=NAME:theForm ATTR=ID:theForm:datePickerSourceSelectElementSales CONTENT=1 
TAG POS=1 TYPE=A ATTR=ID:theForm:downloadLabel2 
ONDOWNLOAD FOLDER=~/Downloads/iTCSales/ FILE=Daily-{{!NOW:yyyymmdd}}-1.txt.gz WAIT=YES 
TAG POS=1 TYPE=SELECT FORM=NAME:theForm ATTR=ID:theForm:datePickerSourceSelectElementSales CONTENT=2 
TAG POS=1 TYPE=A ATTR=ID:theForm:downloadLabel2 
ONDOWNLOAD FOLDER=~/Downloads/iTCSales FILE=Daily-{{!NOW:yyyymmdd}}-2.txt.gz WAIT=YES 
TAG POS=1 TYPE=SELECT FORM=NAME:theForm ATTR=ID:theForm:datePickerSourceSelectElementSales CONTENT=3 
TAG POS=1 TYPE=A ATTR=ID:theForm:downloadLabel2 
ONDOWNLOAD FOLDER=~/Downloads/iTCSales FILE=Daily-{{!NOW:yyyymmdd}}-3.txt.gz WAIT=YES 
TAG POS=1 TYPE=DIV ATTR=TXT:Done 
TAG POS=1 TYPE=DIV ATTR=TXT:Done 
TAG POS=1 TYPE=INPUT:SUBMIT FORM=NAME:signOutForm ATTR=VALUE:Sign<SP>Out 
+0

我通常不使用Windows,所以我討厭保持虛擬機與Windows和Firefox只是運行此。我看到有一個Chrome版本,所以我會看看這是否是跨平臺的。 – 2010-09-10 11:42:57

+0

不要介意我以前的評論--iMacro在Mac OS X上可以工作。我想我一直在看IE插件的系統需求頁面。 – 2010-09-10 14:10:09