提取的頁面我分裂PDF爲頁面與使用命令行的幫助:Ghostscript的失去字體,同時從PDF
for G in $(seq 1 $(pdfinfo 47.pdf | sed -n 's/Pages:[^0-9]*\([0-9]*\).*/\1/p')) ; do
gs \
-dSAFER \
-sDEVICE=pdfwrite \
-dBATCH \
-dNOPAUSE \
-dFirstPage=$G \
-dLastPage=$G \
-o $G.pdf \
47.pdf ;
done
但某些頁面顯示沒有文字(圖形仍然存在)
所以,我已嘗試從PDF中提取嵌入的字體:
gs -q -dNODISPLAY extractFonts.ps -c "(47.pdf) extractFonts quit"
這些字體已安裝在系統字體文件夾中。
之後,我再次分裂,沒有發生變化。
如何確保頁面將被正確提取,我現在不知道。
從PDF中提取字體以重複使用它們的方式通常不會像預期的那樣工作。大多數PDF嵌入字體只有*子集*(不是包含所有字形的完整字體),並且在提取後它們將具有不同的名稱(通常以6個字母作爲前綴的名稱),並且它們將具有非標準編碼......所有這些都使得不可能以可靠的方式重新使用提取的字體。 –