2014-10-31 141 views
12

是否可以將熊貓數據框導出爲圖像文件?像df.to_png()df.to_table().savefig('table.png')將熊貓數據框導出爲表格圖像

此刻我使用df.to_csv()導出數據幀。然後我在Excel中打開這個csv文件,使數據看起來很漂亮,然後將Excel表格複製/粘貼到Powerpoint中作爲圖像。我看到matplotlib有一個.table()方法,但我很難讓它與我的df一起工作。

我使用的DF有5列& 5行,每個「單元格」是一個數字。

在此先感謝。

+0

你爲什麼不只是包括從Excel表格中的PowerPoint演示文稿,而無需創建任何圖像? – 2014-10-31 16:12:25

+0

我會盡量避免使用Excel,即python => Powerpoint – user2370852 2014-10-31 18:29:38

+0

我不知道你確切的先決條件是什麼,但也許你應該重新考慮這一點。將數據渲染爲圖像並不是最好的想法,因爲之後不能更改外觀和大小,從中複製,字體變爲柵格化,並且需要更多空間。 – 2014-10-31 19:28:37

回答

10

如果你有pdflatex和ImageMagick的安裝,你可以導出數據幀到特克斯,使用pdflatex將其轉換爲PDF文件,然後使用ImageMagick的PDF轉換成PNG:

import pandas as pd 
import numpy as np 
import subprocess 

df = pd.DataFrame({'d': [1., 1., 1., 2., 2., 2.], 
        'c': np.tile(['a', 'b', 'c'], 2), 
        'v': np.arange(1., 7.)}) 
filename = 'out.tex' 
pdffile = 'out.pdf' 
outname = 'out.png' 

template = r'''\documentclass[preview]{{standalone}} 
\usepackage{{booktabs}} 
\begin{{document}} 
{} 
\end{{document}} 
''' 

with open(filename, 'wb') as f: 
    f.write(template.format(df.to_latex())) 

subprocess.call(['pdflatex', filename]) 
subprocess.call(['convert', '-density', '300', pdffile, '-quality', '90', outname]) 

enter image description here

如果安裝phantomjs和ImageMagick的,你可以 導出數據框爲HTML,然後使用phantomjs到HTML轉換成PNG和ImageMagick的裁剪結果:

import pandas as pd 
import numpy as np 
import subprocess 

df = pd.DataFrame({'d': [1., 1., 1., 2., 2., 2.], 
        'c': np.tile(['a', 'b', 'c'], 2), 
        'v': np.arange(1., 7.)}) 
filename = '/tmp/out.html' 
outname = '/tmp/out.png' 
cropname = '/tmp/cropped.png' 

with open(filename, 'wb') as f: 
    f.write(df.to_html()) 
rasterize = '/path/to/phantomjs/examples/rasterize.js' 
subprocess.call(['phantomjs', rasterize, filename, outname]) 
subprocess.call(['convert', outname, '-trim', cropname]) 

enter image description here

+0

綜合答案。謝謝! – user2370852 2014-11-15 16:17:24

+1

我似乎通過編碼乳膠字符串'f.write(bytes(template.format(df.to_latex()),'UTF-8'))'來獲得在Python 3中工作的膠乳版本。 – pylang 2015-09-01 04:02:46

9

隨着一些額外的代碼,你甚至可以讓輸出看起來體面:

import pandas as pd 
import numpy as np 
import matplotlib.pyplot as plt 
import six 

df = pd.DataFrame() 
df['date'] = ['2016-04-01', '2016-04-02', '2016-04-03'] 
df['calories'] = [2200, 2100, 1500] 
df['sleep hours'] = [2200, 2100, 1500] 
df['gym'] = [True, False, False] 


def render_mpl_table(data, col_width=3.0, row_height=0.625, font_size=14, 
        header_color='#40466e', row_colors=['#f1f1f2', 'w'], edge_color='w', 
        bbox=[0, 0, 1, 1], header_columns=0, 
        ax=None, **kwargs): 
    if ax is None: 
     size = (np.array(data.shape[::-1]) + np.array([0, 1])) * np.array([col_width, row_height]) 
     fig, ax = plt.subplots(figsize=size) 
     ax.axis('off') 

    mpl_table = ax.table(cellText=data.values, bbox=bbox, colLabels=data.columns, **kwargs) 

    mpl_table.auto_set_font_size(False) 
    mpl_table.set_fontsize(font_size) 

    for k, cell in six.iteritems(mpl_table._cells): 
     cell.set_edgecolor(edge_color) 
     if k[0] == 0 or k[1] < header_columns: 
      cell.set_text_props(weight='bold', color='w') 
      cell.set_facecolor(header_color) 
     else: 
      cell.set_facecolor(row_colors[k[0]%len(row_colors) ]) 
    return ax 

render_mpl_table(df, header_columns=0, col_width=2.0) 

enter image description here

+0

我得到錯誤'ImportError:No module named externals'。 – 2017-05-17 19:48:06

+0

六位標準庫。我已經調整了答案。它應該現在工作 - 感謝指點。它是編寫Python 2和Python 3兼容的代碼。你只需要Python 3嗎? – volodymyr 2017-05-18 10:06:13

+0

這很好。但是,我們如何保存到實際的文件..? – zerohedge 2017-12-03 00:27:34