我的主要目標是從一個巨大的浮點矩陣計算中值(按列)。例如:Python - 從文件中獲取列迭代器(不需要讀取整個文件)
a = numpy.array(([1,1,3,2,7],[4,5,8,2,3],[1,6,9,3,2]))
numpy.median(a, axis=0)
Out[38]: array([ 1., 5., 8., 2., 3.])
矩陣是太大,不適合在Python內存(約5兆兆字節),所以我把它在一個CSV文件。 所以我想跑過每一列並計算中位數。
我有沒有辦法讓列迭代器不讀取整個文件?
關於計算矩陣中位數的任何其他想法也是好的。謝謝!
另請參閱:http://stackoverflow.com/questions/1053928/python-numpy-very-large-matrices –