2011-04-07 77 views
6

我需要從多個不同來源提取銀行賬戶報表。我希望能夠以某種標準化的方式獲取這些數據,無論是CSV,OFX還是XML或其他。我只需要能夠獲得這些數據。我將使用自己的賬戶從交易中獲取交易,所以在那裏不應該有太多的「合法」問題。像Mint.com這樣的網站如何獲得銀行對賬單?他們只是詢問您的帳戶信息,網址,然後關閉並運行。我怎樣才能做到這一點?如何從網站中提取銀行對賬單?

回答

6

用你最喜歡的語言寫一個屏幕刮板來做到這一點。將它自動化。

通常情況下,銀行通過其在線服務爲您提供長達三個月的交易。

當屏幕抓取失敗時,不要忘記讓它按下緊急按鈕。

這裏的主要問題是自動化它,以便(手動運行它)的痛苦消失,以便您看到的是您帳戶的「不斷」更新事務。

+0

我完全不熟悉屏幕抓取。我正在用Python編寫我的應用程序,想知道從哪裏開始,模塊化?我發現了Bankjob(一個Ruby刮板),但我真的需要Python。我的銀行確實支持向OFX出口交易,但沒有特別的方法來自動化,除了通過刮擦。謝謝。 – 2011-04-07 19:05:31

+1

看看美麗的湯:http://www.crummy.com/software/BeautifulSoup/。這是相當不錯的。 – holygeek 2011-04-08 00:24:01

+2

如何編寫一個屏幕抓取工具來處理以下事實:某些銀行在登錄過程中運行了複雜的JavaScript,並且需要在沒有GUI的情況下從命令行運行scraper? – Michael 2012-05-25 21:05:29

0

我在前面閱讀了一篇全面的技術文章,但是我找不到它。從我的記憶中,這是什麼樣薄荷確實讓從銀行的數據:從這個公司

  1. 查詢API:http://www.finappstore.com/
  2. 如果銀行不在上述API,他們退卻到屏幕抓取
+0

我對這個網站如何幫助任何人感到困惑。他們是否有API來獲取語句?即:是否值得我花時間在他們身上註冊? ;) – 2011-04-07 19:07:43

+0

我認爲finappstore API只能通過他們的代碼/協議從flex獲得。 – 2011-06-04 16:24:33

3

如果您對簡單的個人解決方案感興趣,一種簡單的方法是讓Mint彙總您的所有購買並使用現有的刮板下載它們。像這樣的:https://github.com/mrooney/mintapi

0

你可能會考慮的其他主要事情是Plaid(更商業化的產品,但看起來非常好)和https://www.buxfer.com它有一個免費的API。薄薄到最近使刮刀刮擦它變得更加困難。