pytables

    0熱度

    1回答

    在熊貓中,我使用貨幣工作了很多。到目前爲止,我一直在使用默認的浮點數,但處理精度不足的問題令人討厭並且容易出錯。我試圖切換到使用Decimal來處理某些部分,雖然它可能會使計算速度變慢很多,但確實如此。然而,當我嘗試保存到一個大熊貓存儲(例如hdf5store通過pytables)我得到: TypeError: Cannot serialize the column [o] because its

    2熱度

    1回答

    追加,我得到以下錯誤: exportStore.append(key, hdfStoreLocal, index = False, data_columns = True) File "/usr/local/lib/python2.7/dist-packages/pandas-0.14.1-py2.7-linux-x86_64.egg/pandas/io/pytables.py", li

    2熱度

    1回答

    因此,我將數據文件解析爲熊貓數據框,然後使用HDFStore將文件保存到hdf5。代碼: def convert_folder_hdf5(folder, save_loc=None): if save_loc is None: save_loc = folder filename = save_loc+'\\' + (folder.split('\\')[-1])

    0熱度

    2回答

    我正在使用來自大型hdf5文件的read_where方法讀取來自pytables.Table(版本3.1.1)的大量數據。由此產生的numpy數組大約有420 MB,但是在調用read_where時,我的python進程的內存消耗增加了1.6GB,並且在調用完成後內存不再釋放。即使刪除數組,關閉文件並刪除hdf5文件句柄也不會釋放內存。 如何再次釋放此內存?

    6熱度

    1回答

    我剛剛在新鮮的Mac OS安裝中通過自制啤酒安裝了pip和Python。 首先,我的pip並未安裝依賴關係 - 這迫使我重新運行'pip install tables'3次,每次它會告訴我一個依賴項,然後我將安裝它並重新運行一次。這是預期的行爲? 其次,它不接受用Cython的安裝,它剛纔本身安裝: $ pip show cython --- Name: Cython Version: 0.

    1熱度

    1回答

    是否清楚我在做什麼錯? 我與熊貓試驗HDFStore.select 開始和停止選項,它不是產生變化。 我使用的命令是: import pandas as pd hdf = pd.HDFStore(path % 'results') len(hdf.select('results',start=15,stop=20)) 希望得到的4或5然而它的計算,但它給我的整個該死的數據幀的長度。 這裏是

    1熱度

    2回答

    我的問題是,當我試圖尋找一個字符串不包含在DataFrame(它存儲在hdf5文件中)時,它需要很長時間完成查詢。例如: 我有一個包含2 * 10^9行的df。它存儲在HDF5文件中。我有一個名爲「code」的字符串列,它被標記爲「data_column」(因此它被索引)。 當我搜索數據集中存在的代碼(store.select('df','code = valid_code'))時,大約需要10秒

    0熱度

    1回答

    在python 3.4.1中導入pytables(3.1.1)失敗,抱怨cPickle導入失敗 我嘗試在python(3.4.1)中使用potables(3.1.1) In [1]: import tables --------------------------------------------------------------------------- ImportError

    2熱度

    1回答

    我有一個需要進入生產服務器的PyTables依賴的Flask應用程序。不幸的是,必須用於安裝所有依賴關係的腳本僅適用於所有內容均可被pip install -r requirements.txt拉入。換句話說,運行腳本/使用setup.py是不可能的。 PyTables在安裝時需要numpy才能構建(以及numexpr和cython),因此只需將依賴項依次放入requirements.txt中就會

    2熱度

    1回答

    我工作的一些CFD的仿真與C/CUDA和Python,此刻的工作流程是這樣的: 開始寫在純C模擬/ cuda 將輸出寫入二進制文件 用python重新打開文件即numpy.fromfile並做一些分析。 由於我有很多數據和一些元數據我雖然它會更好 切換到hdf5文件格式。所以我的想法是這樣的, 爲我的模擬使用pytables創建一些初始條件數據。 使用標準hdf5庫重新打開並寫入c中的數據集。 使