2
我正在嘗試導入~12萬條帶有8列的記錄到Python中。由於其巨大的尺寸,我的筆記本電腦內存不足以滿足此需求。現在我試圖將SQL數據導入HDF5文件格式。如果有人可以共享一段代碼來查詢SQL數據並將其以HDF5格式保存成塊,那將會非常有幫助。我打算使用任何其他易於使用的文件格式。從SQL服務器導入海量數據集到HDF5
我打算做一些基本的探索性分析,稍後可能會使用熊貓創建一些決策樹/線性迴歸模型。
import pyodbc
import numpy as np
import pandas as pd
con = pyodbc.connect('Trusted_Connection=yes',
driver = '{ODBC Driver 13 for SQL Server}',
server = 'SQL_ServerName')
df = pd.read_sql("select * from table_a",con,index_col=['Accountid'],chunksize=1000)
謝謝你這麼多MaxU,這工作:d。 – user3510503
@ user3510503,很高興幫助:) – MaxU