用numpy.savetxt實現不同的列格式

我想用numpy.savetxt創建一個.csv文件。文件的每個row都指示某個事件。每行有多個columns表示事件的不同元素。存儲在每個column中的信息是不同的。某些columns將包含單個float值，而其他應包含相互連接的兩個floats。如果我在加載.csv時調用該列，我應該獲得兩個float值。用numpy.savetxt實現不同的列格式

我有以下代碼：

import numpy 

rows = 5 
columns = 2 
save_values = numpy.zeros((rows, columns)) 

for idx in xrange(rows): 
    column_0 = float(idx) 
    column_1 = [idx + 5., idx + 15.] 

    save_values[idx, :] = column_0, column_1 

numpy.savetxt("outfile.csv", save_values, delimiter = ",")

然而，這將導致以下錯誤消息：

save_values[idx, :] = column_0, column_1 
ValueError: setting an array element with a sequence.

這是可以理解的。然而，儘管知道爲什麼會出錯，但我很難實現我的目標。

我該如何實現目標？

來源

2016-09-28 The Dude

在numpy數組中，所有元素必須具有相同的類型，即不能讓第一列爲數字，第二列爲numpy數組中的向量。你需要熊貓表。 – user40314

但是，您可以使用[結構化numpy數組]（http://docs.scipy.org/doc/numpy/user/basics.rec.html），其中的字段具有不同的dtype。 –

您甚至沒有進入savetxt步驟。

save_values[idx, :] = column_0, column_1

目標是2個值（2列）。來源是idx和一個列表。

這就是爲什麼它給你'設置一個序列'的錯誤。它不能將該列表放入save_values[idx,1]。

您可以定義一個有2個字段的save_values數組，其中一個字段有2個元素。但是，你將如何拯救它？

應如何顯示文本文件 - 由,分隔的3列？或者在第二個內部具有特殊結構的兩個柱子，例如

1.2, 3.5, 4.2 # or 
1.2, [2.5, 4.2]

這反過來引發了什麼可以加載的問題。 genfromtxt可以處理3列;它不能輕鬆交付嵌套的列。默認情況下，genfromtxt會將3列大小寫爲3列，但可以給它2個字段dtype。

無論如何，爲了節省我認爲生成3列是最簡單的。重新加載可以用列或字段來完成。

我可以生成與化合物D型數組：

In [329]: dt = np.dtype('i,(2,)f') 
In [330]: dt 
Out[330]: dtype([('f0', '<i4'), ('f1', '<f4', (2,))]) 
In [331]: save_values = np.zeros((5,),dtype=dt) 
In [332]: for i in range(5): 
    ...:  save_values[i]=(i,(i+5., i+15.)) 
    ...:  
In [333]: save_values 
Out[333]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]), 
     (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
     dtype=[('f0', '<i4'), ('f1', '<f4', (2,))])

但是，如果我試圖挽救它，我得到一個錯誤

In [334]: np.savetxt('test.txt',save_values,delimiter=',') 
... 
TypeError: Mismatch between array dtype ('[('f0', '<i4'), ('f1', '<f4', (2,))]') and format specifier ('%.18e,%.18e')

我可以拼出寫入格式保存，fmt%tuple(save_values[0]) ，但這使[]輸出：

In [335]: np.savetxt('test.txt',save_values,fmt='%10d, %s') 
In [336]: cat test.txt 
     0, [ 5. 15.] 
     1, [ 6. 16.] 
     2, [ 7. 17.] 
     3, [ 8. 18.] 
     4, [ 9. 19.]

我可以拼合ŧ他陣列D型，以期（在這裏我保持第一場整數只是爲了讓事情變得有趣）：

In [337]: dt1=np.dtype('i,f,f') 
In [338]: save_values.view(dt1) 
Out[338]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0), 
     (4, 9.0, 19.0)], 
     dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')])

現在我可以將它保存爲3列：

In [340]: np.savetxt('test.txt',save_values.view(dt1),fmt='%10d, %10f, %10f') 
In [341]: cat test.txt 
     0, 5.000000, 15.000000 
     1, 6.000000, 16.000000 
     2, 7.000000, 17.000000 
     3, 8.000000, 18.000000 
     4, 9.000000, 19.000000

，我可以重新加載它無論是D型：

In [342]: np.genfromtxt('test.txt',delimiter=',',dtype=dt) 
Out[342]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]), 
     (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
     dtype=[('f0', '<i4'), ('f1', '<f4', (2,))]) 

In [343]: np.genfromtxt('test.txt',delimiter=',',dtype=dt1) 
Out[343]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0), 
     (4, 9.0, 19.0)], 
     dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')])

我也用浮漂的5X3陣列創建的text.txt。

savetxt的關鍵點在於它遍歷數組的行，格式化它們並將該行寫入文件。所以，你的陣列具有帶工作：

for row in myarray: 
    print(fmt % tuple(row))

fmt可拼寫出，或可從單個字段格式，如建立。

fmt = ','.join(['%10f']*3) # or 
fmt = '%10d, %10f, %10f'

所以它歸結爲標準的Python字符串格式。

來源

2016-09-29 00:28:19 hpaulj

用numpy.savetxt實現不同的列格式

回答

相關問題