2016-09-28 263 views
0

我想用numpy.savetxt創建一個.csv文件。文件的每個row都指示某個事件。每行有多個columns表示事件的不同元素。存儲在每個column中的信息是不同的。某些columns將包含單個float值,而其他應包含相互連接的兩個floats。如果我在加載.csv時調用該列,我應該獲得兩個float值。用numpy.savetxt實現不同的列格式

我有以下代碼:

import numpy 

rows = 5 
columns = 2 
save_values = numpy.zeros((rows, columns)) 

for idx in xrange(rows): 
    column_0 = float(idx) 
    column_1 = [idx + 5., idx + 15.] 

    save_values[idx, :] = column_0, column_1 

numpy.savetxt("outfile.csv", save_values, delimiter = ",") 

然而,這將導致以下錯誤消息:

save_values[idx, :] = column_0, column_1 
ValueError: setting an array element with a sequence. 

這是可以理解的。然而,儘管知道爲什麼會出錯,但我很難實現我的目標。

我該如何實現目標?

+0

在numpy數組中,所有元素必須具有相同的類型,即不能讓第一列爲數字,第二列爲numpy數組中的向量。你需要熊貓表。 – user40314

+0

但是,您可以使用[結構化numpy數組](http://docs.scipy.org/doc/numpy/user/basics.rec.html),其中的字段具有不同的dtype。 –

回答

1

您甚至沒有進入savetxt步驟。

save_values[idx, :] = column_0, column_1 

目標是2個值(2列)。來源是idx和一個列表。

這就是爲什麼它給你'設置一個序列'的錯誤。它不能將該列表放入save_values[idx,1]

您可以定義一個有2個字段的save_values數組,其中一個字段有2個元素。但是,你將如何拯救它?

應如何顯示文本文件 - 由,分隔的3列?或者在第二個內部具有特殊結構的兩個柱子,例如

1.2, 3.5, 4.2 # or 
1.2, [2.5, 4.2] 

這反過來引發了什麼可以加載的問題。 genfromtxt可以處理3列;它不能輕鬆交付嵌套的列。默認情況下,genfromtxt會將3列大小寫爲3列,但可以給它2個字段dtype

無論如何,爲了節省我認爲生成3列是最簡單的。重新加載可以用列或字段來完成。

我可以生成與化合物D型數組:

In [329]: dt = np.dtype('i,(2,)f') 
In [330]: dt 
Out[330]: dtype([('f0', '<i4'), ('f1', '<f4', (2,))]) 
In [331]: save_values = np.zeros((5,),dtype=dt) 
In [332]: for i in range(5): 
    ...:  save_values[i]=(i,(i+5., i+15.)) 
    ...:  
In [333]: save_values 
Out[333]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]), 
     (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
     dtype=[('f0', '<i4'), ('f1', '<f4', (2,))]) 

但是,如果我試圖挽救它,我得到一個錯誤

In [334]: np.savetxt('test.txt',save_values,delimiter=',') 
... 
TypeError: Mismatch between array dtype ('[('f0', '<i4'), ('f1', '<f4', (2,))]') and format specifier ('%.18e,%.18e') 

我可以拼出寫入格式保存,fmt%tuple(save_values[0]) ,但這使[]輸出:

In [335]: np.savetxt('test.txt',save_values,fmt='%10d, %s') 
In [336]: cat test.txt 
     0, [ 5. 15.] 
     1, [ 6. 16.] 
     2, [ 7. 17.] 
     3, [ 8. 18.] 
     4, [ 9. 19.] 

我可以拼合ŧ他陣列D型,以期(在這裏我保持第一場整數只是爲了讓事情變得有趣):

In [337]: dt1=np.dtype('i,f,f') 
In [338]: save_values.view(dt1) 
Out[338]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0), 
     (4, 9.0, 19.0)], 
     dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')]) 

現在我可以將它保存爲3列:

In [340]: np.savetxt('test.txt',save_values.view(dt1),fmt='%10d, %10f, %10f') 
In [341]: cat test.txt 
     0, 5.000000, 15.000000 
     1, 6.000000, 16.000000 
     2, 7.000000, 17.000000 
     3, 8.000000, 18.000000 
     4, 9.000000, 19.000000 

,我可以重新加載它無論是D型:

In [342]: np.genfromtxt('test.txt',delimiter=',',dtype=dt) 
Out[342]: 
array([(0, [5.0, 15.0]), (1, [6.0, 16.0]), (2, [7.0, 17.0]), 
     (3, [8.0, 18.0]), (4, [9.0, 19.0])], 
     dtype=[('f0', '<i4'), ('f1', '<f4', (2,))]) 

In [343]: np.genfromtxt('test.txt',delimiter=',',dtype=dt1) 
Out[343]: 
array([(0, 5.0, 15.0), (1, 6.0, 16.0), (2, 7.0, 17.0), (3, 8.0, 18.0), 
     (4, 9.0, 19.0)], 
     dtype=[('f0', '<i4'), ('f1', '<f4'), ('f2', '<f4')]) 

我也用浮漂的5X3陣列創建的text.txt

savetxt的關鍵點在於它遍歷數組的行,格式化它們並將該行寫入文件。所以,你的陣列具有帶工作:

for row in myarray: 
    print(fmt % tuple(row)) 

fmt可拼寫出,或可從單個字段格式,如建立。

fmt = ','.join(['%10f']*3) # or 
fmt = '%10d, %10f, %10f' 

所以它歸結爲標準的Python字符串格式。