pytables

0熱度

1回答

在熊貓中，我使用貨幣工作了很多。到目前爲止，我一直在使用默認的浮點數，但處理精度不足的問題令人討厭並且容易出錯。我試圖切換到使用Decimal來處理某些部分，雖然它可能會使計算速度變慢很多，但確實如此。然而，當我嘗試保存到一個大熊貓存儲（例如hdf5store通過pytables）我得到： TypeError: Cannot serialize the column [o] because its

2熱度

1回答

hdfstore誤差與大熊貓

追加，我得到以下錯誤： exportStore.append(key, hdfStoreLocal, index = False, data_columns = True) File "/usr/local/lib/python2.7/dist-packages/pandas-0.14.1-py2.7-linux-x86_64.egg/pandas/io/pytables.py", li

2熱度

1回答

store.root.attributes not saving - 熊貓和Pytables

因此，我將數據文件解析爲熊貓數據框，然後使用HDFStore將文件保存到hdf5。代碼： def convert_folder_hdf5(folder, save_loc=None): if save_loc is None: save_loc = folder filename = save_loc+'\\' + (folder.split('\\')[-1])

0熱度

2回答

如何避免在pytables中使用高內存？

我正在使用來自大型hdf5文件的read_where方法讀取來自pytables.Table（版本3.1.1）的大量數據。由此產生的numpy數組大約有420 MB，但是在調用read_where時，我的python進程的內存消耗增加了1.6GB，並且在調用完成後內存不再釋放。即使刪除數組，關閉文件並刪除hdf5文件句柄也不會釋放內存。如何再次釋放此內存？

6熱度

1回答

Pip不承認Cython

我剛剛在新鮮的Mac OS安裝中通過自制啤酒安裝了pip和Python。首先，我的pip並未安裝依賴關係 - 這迫使我重新運行'pip install tables'3次，每次它會告訴我一個依賴項，然後我將安裝它並重新運行一次。這是預期的行爲？其次，它不接受用Cython的安裝，它剛纔本身安裝： $ pip show cython --- Name: Cython Version: 0.

1熱度

1回答

HDFStore啓動停止不起作用

是否清楚我在做什麼錯？我與熊貓試驗HDFStore.select 開始和停止選項，它不是產生變化。我使用的命令是： import pandas as pd hdf = pd.HDFStore(path % 'results') len(hdf.select('results',start=15,stop=20)) 希望得到的4或5然而它的計算，但它給我的整個該死的數據幀的長度。這裏是

1熱度

2回答

大熊貓HDFStore：慢查詢不匹配的字符串

我的問題是，當我試圖尋找一個字符串不包含在DataFrame（它存儲在hdf5文件中）時，它需要很長時間完成查詢。例如：我有一個包含2 * 10^9行的df。它存儲在HDF5文件中。我有一個名爲「code」的字符串列，它被標記爲「data_column」（因此它被索引）。當我搜索數據集中存在的代碼（store.select（'df'，'code = valid_code'））時，大約需要10秒

0熱度

1回答

在python3下使用pytables失敗

在python 3.4.1中導入pytables（3.1.1）失敗，抱怨cPickle導入失敗我嘗試在python（3.4.1）中使用potables（3.1.1） In [1]: import tables --------------------------------------------------------------------------- ImportError

2熱度

1回答

僅使用requirements.txt安裝PyTables

我有一個需要進入生產服務器的PyTables依賴的Flask應用程序。不幸的是，必須用於安裝所有依賴關係的腳本僅適用於所有內容均可被pip install -r requirements.txt拉入。換句話說，運行腳本/使用setup.py是不可能的。 PyTables在安裝時需要numpy才能構建（以及numexpr和cython），因此只需將依賴項依次放入requirements.txt中就會

2熱度

1回答

現場分析/ HDF5

我工作的一些CFD的仿真與C/CUDA和Python，此刻的工作流程是這樣的：開始寫在純C模擬/ cuda 將輸出寫入二進制文件用python重新打開文件即numpy.fromfile並做一些分析。由於我有很多數據和一些元數據我雖然它會更好切換到hdf5文件格式。所以我的想法是這樣的，爲我的模擬使用pytables創建一些初始條件數據。使用標準hdf5庫重新打開並寫入c中的數據集。使