我們正在研究pandas.io.gbq
,我們注意到大型結果集的一些不尋常行爲。代碼大致如下所示(其中bq
來自bq.py)。前幾頁的數據返回有效的pageTokens,但之後,每對夫婦都沒有返回。 https://gist.github.com/jacobschaer/8309204BigQuery結果不包括頁面標記
import bq
import bigquery_client
#.
#.
#.
client = bq.Client.Get()
kwds = {'timeoutMs': 0, u'projectId': u'xxxxxxx', 'startIndex': 0, 'maxResults': 1000000, u'jobId': u'bqjob_r36320b28158a7c96_000001436eb0431c_1'}
data = client.apiclient.jobs().getQueryResults(**kwds).execute()
這可能涉及到:BigQuery paging issues with tableData.list()
最終,我們與結果集中的重複清盤JSON的修剪副本退換可瀏覽。
調查... –